dataflow 相关问题

数据流编程是一种编程范例,其中计算通过有向图建模:节点是指令,数据通过它们之间的连接流动。

谷歌云数据流java API没有读取其他项目的pubsub主题

我只有一个在生产项目中创建的主题。我想在开发环境中运行我的数据流作业,这需要使用生产pubsub主题。当我在dev中提交我的数据流作业时......

回答 1 投票 1

如何阅读文本文件并使用TextIO返回其他输入字段?

我有一个KV的PCollection,其中key是filename,value是文件的一些附加信息(例如,生成文件的“Source”系统)。例如,KV(“gs://bucket1/dir1/X1.dat”,“SourceX”),...

回答 1 投票 0

数据流模板未采用输入参数

我有一个使用以下命令创建的数据流模板mvn compile exec:java \ -Dexec.mainClass = com.StarterPipeline \ -Dexec.args =“ - runner = DataflowRunner \ --project = jason-qa \ ...

回答 1 投票 0

防止Apache Beam / Dataflow流(python)管道中的融合以消除管道瓶颈

我们目前正在使用DataflowRunner在Apache Beam上开发流式传输管道。我们正在阅读Pub / Sub中的消息并对它们进行一些处理,之后我们将它们放在滑动中...

回答 1 投票 4

从BigQuery缓慢更改查找缓存 - Dataflow Python Streaming SDK

我正在尝试遵循慢慢更改查找缓存的设计模式(https://cloud.google.com/blog/products/gcp/guide-to-common-cloud-dataflow-use-case-patterns-part-1)对于流媒体管道......

回答 1 投票 1

在DataFlow上运行光束管道时关闭后文件被覆盖

我创建了一个在数据流上运行的beam管道p,并希望在运行我的管道之前将某些内容写入文件。我的代码是:从apache_beam.options导入apache_beam作为beam ....

回答 1 投票 0

以编程方式运行Magento 1.9.1.0数据流导入配置文件

我试图让这个工作,但似乎找不到解决方案。我正在寻找运行ID = 3的现有数据流配置文件,并且已经配置了导入文件名。一切 ...

回答 1 投票 5

dataflow管道python依赖安装但无法导入

我有一个简单的数据流管道,可以在我的本地机器上成功运行:import argparse import logging import ast import apache_beam as beam from apache_beam.options.pipeline_options import ...

回答 2 投票 0

NCLaunch中的VHDL代码给出了Xilinx中未给出的错误

我正在尝试在VHDL中为比较器进行数据流设计。它在Xilinx中编译和模拟很好,但我必须使用Cadence / NCLaunch。当我将相同的代码复制到gedit并运行它时,它给出了......

回答 1 投票 0

从PCollections获取列表

我想从Pcollection得到一个列表值。 PCollection > lst = bqT2.apply(ParDo.of(new UserId())); //第1行列出myList = lst.getAll(); //第2行,但没有“getAll()...

回答 2 投票 0

在Vue模式中将数组作为道具传递

我想在vueJs中将数组从一个组件传递到另一个组件,我可以这样做 在我的其他组件中......

回答 2 投票 0

使用airflow的DataflowPythonOperator计划数据流作业时出错

我正在尝试使用airflow的DataflowPythonOperator来安排数据流作业。这是我的dag运算符:test = DataFlowPythonOperator(task_id ='my_task',py_file ='path / my_pyfile.py',...

回答 1 投票 3

TPL Dataflow块消耗所有可用内存

我有一个具有以下设计的TransformManyBlock:输入:文件的路径输出:IEnumerable文件的内容,一次一行我在一个巨大的文件(61GB)上运行这个块,这是...

回答 2 投票 6

Cloud Dataflow控制台仪表板中未列出Cloud Dataflow作业

我尝试使用下面的命令行参数执行我的python数据流代码。 python upload_simple_csv.py --runner DataflowRunner --project bigquery-poc-188207 --save_main_session True --...

回答 1 投票 0

ETL从谷歌云存储加载到bigquery

我想从Google云存储上的数百个CSV文件加载数据,并使用云数据流(最好使用python SDK)将它们每天附加到Bigquery上的单个表中。请你 ...

回答 1 投票 0

在数据流任务中,如何使用来自其他源的值限制流动的行?

我有一张带有很多标签的excel表。假设一个叫做wsMain而另一个叫做wsDate。在我的数据流转换中,我能够成功地将wsMain中的数据加载到我的表中。现在我 ...

回答 3 投票 2

我如何获得可读文件?

我有一个目录,里面有99个文件,我想读取这些文件,然后将它们哈希到sha256校验和中。我最终想要将它们输出到具有键值对的JSON文件中,例如(...

回答 1 投票 0

定期批处理混合流 - 玩具问题说明我的问题

这是一个组成的玩具示例,试图获得有关我的问题的更难部分的帮助。假设我有来自Kafka流的销售数据:...期间:5,SalesPersonId:78,销售:TRUE,......

回答 1 投票 0

如何使用Apache Beam反序列化Kafka AVRO消息

主要目标是聚合两个Kafka主题,一个压缩的慢速移动数据和另一个每秒接收的快速移动数据。我已经能够简单地消费消息了......

回答 4 投票 1

是否可以将Apache NiFi用作MS SQL Server数据库内计算的数据流引擎?

是否可以将Apache NiFi用作MS SQL Server数据库内计算的数据流引擎?换句话说,我想使用Apache NiFi就像我使用Alteryx一样。例如,我可以执行两个......

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.