google-cloud-dataflow 相关问题

Google Cloud Dataflow是一种完全托管的云服务,可用于大规模创建和评估数据处理管道。数据流管道基于Apache Beam编程模型,可以在批处理和流模式下运行。 Cloud Dataflow是Google云端平台的一部分。

Azure Dataflow - 资源引用无法加载的资源

我有一组管道、数据流和触发器,在验证时会显示错误消息:此资源引用了无法加载的资源。手动合并 f 后发生这种情况...

回答 1 投票 0

GCP 数据流作业中的并发处理

我尝试使用 ThreadPoolExecutor 同时运行三个不同的类。但数据流作业似乎没有同时运行,并且它正在一个接一个地运行每个类。还有...

回答 1 投票 0

Apache Beam,在 DoFn 的 @Setup Lifecycle 方法中初始化的模拟外部客户端

我创建了以下 DoFn 类,但我不确定如何模拟 APIClient,因为使用模拟的 APICall 对象在 Junit 中创建 JsonToGenericRecordMapper 的实例正在被覆盖...

回答 2 投票 0

Cloud Dataflow 故障恢复

我想使用 Google Cloud Dataflow 创建会话窗口,如数据流模型论文中所述。我想将未绑定的数据发送到 Pub/Sub,然后在 Cloud Dataflow 中读取它

回答 2 投票 0

我的 PowerBi Desktop 中无法进行异常检测

我有02个严重的担忧: 1- 我的 Power Bi Desktop 中无法使用“异常检测” 版本:2.124.2028.0 64 位(2023 年 12 月)。请帮助我解决第一个问题,因为我没有...

回答 1 投票 0

从 BigQuery 加载数百万元数据作为缓存,以丰富 Dataflow 中的流事件

我有以下用例:我正在流式传输来自 Kafka 主题的事件。我的计划是阅读这些事件,对于每一个事件,我都需要使用 BigQuery 中存在的一些元数据来丰富它。让我们假设...

回答 1 投票 0

我可以将压缩的 jsonl 数据从 GCS 加载到 BigQuery 并使用 DataFlow 添加额外的日期列吗

借助这篇文章,我想创建一个梁数据流作业来将数据从 GCS 加载到 Bigquery。 GCS 存储桶中有数千个文件,所有这些文件都非常庞大并且

回答 1 投票 0

将 Zuora 与 GCP Bigquery 集成

我想设置一个数据流管道以将数据从 Zuora 迁移到 BigQuery。 为此应采取哪些步骤?我对 Zuora 很陌生。

回答 1 投票 0

如何在 apache beam 中顺序运行单个管道来写入和读取数据

我使用 apache beam 和 python 在数据流(gcp)上使用它来加载和转换数据巴克斯。 我有一个管道,它分为不同的部分。 第一部分,写入bigquery。

回答 1 投票 0

在工作流程中使用 api Rest 从数据流作业获取作业状态

我使用工作流来编排 2 个数据流作业。 我想使用 api rest 获取作业状态,到目前为止,我无法从作业中获取当前状态。 主要的: 参数:[输入] 脚步: - 发射: ...

回答 1 投票 0

如何为 Apache Beam/Dataflow 经典模板 (Python) 和数据管道实现 CI/CD 管道

在 Python 中实现 Apache Beam/Dataflow 经典模板和管道的 CI/CD 构建过程的最佳方法是什么?我只找到了有关 Java 的教程,其中包括工件重新...

回答 2 投票 0

如何使用服务帐户通过Cloud Composer dag执行API调用

我有一个数据流应用程序代码,它从 Bigquery 读取数据并写入 GCS 存储桶和一些其他处理。我成功地能够使用 Dataflow Worker 从 Dataflow UI 运行此代码

回答 2 投票 0

Dataflow Tensorflow Transform 将转换后的数据写入 BigQuery

在 GCP Dataflow 管道中,我尝试将转换组件中的转换数据写入 Bigquery 中,但出现以下错误。首先,如果有人能让我知道是否...

回答 1 投票 0

如何解决azure数据流中的“客户端初始化失败。检查端点是否可访问以及您的身份验证令牌是否有效”问题

您好,我创建了一个 Azure 数据流,将 json 从 json 文件传输到 cosmos db。 CosmosDbNoSql 链接服务连接成功。 json文件的Blob存储链接服务连接成功...

回答 1 投票 0

MySQL JSON_OBJECT 不会生成写入 BigQyery 所需的换行符分隔的 json

我有一个数据流管道,它从 MySQL 读取数据并将其写入 BigQuery。管道失败,问题是从 MySQL 读取的数据格式不是 NEWLINE DELIMITED JSON。 MySQL 罗...

回答 1 投票 0

MongoDB 到 Bigquery(批量)数据流模板 - UDF 不起作用

我们正在尝试按计划将 mongoDB 中的当前数据加载到 bigquery 中。目前正在尝试使用谷歌云的数据流服务与 MongoDB 到 Bigquery(批量)模板一起使用...

回答 1 投票 0

突触数据流中的展平活动中的动态“展开依据”

我有三个在数据层次结构方面相似的 XML 文件。在 Synapse 数据流中使用展平活动时是否可以使用动态“展开依据”?我尝试创建一个参数来...

回答 1 投票 0

Azure 数据工厂中的 HASHBYTES

因此,我们发现了这个奇怪的用例,其中带有 MD5 的函数 HASHBYTES 的结果在 COPY Data 与使用(MD5 函数)的 ADF DataFlow 中给出了不同的输出。 所以复制数据使用(允许)利用 HASHB...

回答 1 投票 0

在 Dataflow Python flex 模板中包含另一个文件,ImportError

是否有一个包含多个文件的 Python 数据流 Flex 模板示例,其中脚本导入同一文件夹中包含的其他文件? 我的项目结构是这样的: ├── 管道...

回答 5 投票 0

数据流流错误并显示工作流失败错误消息

运行我的数据流作业时,它很早就失败了(没有数据处理,似乎没有启动工作程序),并显示一条错误消息: 工作流程失败。 我尝试运行基于...的流数据流作业

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.