etl 相关问题

ETL是Extract,Transform和Load的首字母缩写。它指的是从源系统提取数据,以某种方式转换数据(操纵它,过滤它,将其与其他源组合),最后将转换后的数据加载到目标系统的过程。

不同的映射条件

我正在做 ETL,我的主要数据流经数据块中的管道,我想将它与另一个文件合并,我在其中匹配来自两个数据集的 6 列。然而,其中一些专栏......

回答 0 投票 0

如何在DBT中设置profiles.yml和dbt_project.yml文件的位置?

运行 dbt debug --config-dir 显示不正确的位置。 例如。) 12:35:52 使用 dbt=1.0.3 运行 12:35:52 要查看您的 profiles.yml 文件,请运行: 打开/The/wrong/目录 我怎么告诉DBT...

回答 3 投票 0

我该如何解决? [关闭]

tdbCommit_1 错误:-参数(组件列表)为空,但它是必需的。人才开放工作室 在此处输入图片描述 d

etl
回答 0 投票 0

在 SQL 中去除非 X12 字符

我没有找到这个所以我想我会发布它。我需要一个函数来去除 X12 字段中不允许的字符。 允许的基本字符集: 大写字母 A B C D E F G H I J K L M N...

回答 0 投票 0

Excel 输入 Pentaho - 字符串到数字

我正在尝试在 Pentaho 中进行 xlsx 输入,但它一直给我这个错误信息: “将值 [v String] 转换为数字时发生意外转换错误” 我有一个值列......

回答 0 投票 0

有条件地读取 pyspark(databricks)中的 SQL-Server 表,而不是整个表

有什么方法可以根据条件从sql-server表中将数据读入pyspark数据帧,例如只读行,其中“time_stamp”列具有当前日期? 或者,我想翻译: 选择...

回答 0 投票 0

无法使用 stambia S19 将 http api 加载到 rdbms

这是映射 这是元数据 在创建元数据(一个非常简单的元数据)时,反向工作就好了 但是在执行过程(或映射)时我会遇到很多错误,每次我尝试...

回答 0 投票 0

在 ETL 管道中转换数据戳

我有一个 CSV,其中的日期列格式为 2023 年 5 月 1 日。我想将日期提取到我的 SQL Server 中,但出现以下错误: [平面文件源 [48]] 错误:数据转换失败。数据

回答 0 投票 0

CDC 是否涵盖数据架构更改?

我们正在尝试开发具有更改数据捕获(CDC)的数据提取模块。 对于要使用的工具包,我们暂时考虑 1) Kafka、Debezium 和/或 Airbyte,2) Logstash,或 3) 任何 ...

回答 0 投票 0

有没有办法让 Pentaho 作业只获取新记录而不重新运行旧记录?

我有这个解析 JSON 数据的查询。我将查询添加到 Pentaho 转换中,运行 Pentaho 作业需要很长时间(大约 20 分钟),而且我们每天都有新的 ID 记录,所以我

回答 0 投票 0

在从两个不同环境同步增量时,在源表中删除记录时删除汇表中的记录

我创建了一个管道,将数据从 SQL Server A 同步到 SQL Server B。它们都在本地运行,但在不同的服务器上。由于有些地方有相当多的数据......

回答 0 投票 0

灵活的文件任务 - SSIS - 无法从 Azure Blob 存储中删除

我能够从 azure blob 存储帐户复制文件没问题但是一旦下载我想从存储中删除它们。 每当我设置一个灵活的文件任务并设置删除时,我都会得到

回答 0 投票 0

ADF 在从 Azure SQL DB 资源获取数据时是否只接受 XML?

我使用 ADF 从 Dataleke 存储在 Azure SQL DB 上开发了一个事务生产服务器。 现在我们需要通过开发一个 ETL 管道来使用 Azure 数据工厂创建另一个流...

回答 0 投票 0

Meltano ETL 在从源 PostgreSQL 数据库中删除后不删除目标 PostgreSQL 数据库中的行

我正在使用 Meltano 进行 ETL,使用 tap-postgres(MeltanoLabs 变体)从源 PostgreSQL 数据库中提取数据,并使用 target-postgres(

回答 1 投票 0

混合使用 Azure 和本地系统实现 ETL 自动化的最佳方式

我有一个 ETL 自动化系统,它由 10 多个用 C# 编写的控制台应用程序组成,所有这些应用程序当前都在本地客户端计算机上运行。这些控制台应用程序以手动方式工作...

回答 0 投票 0

用于处理多个流的库

我需要有关构建应用程序的建议,该应用程序将: 连接到内容类型流:文本/事件流 可以有 1+ 个流(所有流都具有相同的数据模型) 聚合传入消息...

回答 0 投票 0

将 SQL 地理类型列加载到 Vertica 时出错

我试图将浮点类型的纬度和经度列转换为 SQL 中的地理类型,然后将它们加载到 Vertica 表中。 我使用以下代码将列转换为

回答 1 投票 0

如何获取地图,并将它们的键组合成地图向量?

我有这样的数据: [{:a [{0 0} {2 2} {9 9}]} {:b [{2 2} {5 6} {7 7}]} {:c [{0 1} {5 5} {5 3}]}] 我想把它变成这样: [{:a {0 0} :b {2 2...

回答 3 投票 0

在 ADF 中参数化 IR 名称

我需要在部署期间将 IR 名称作为参数传递到 ADF 模板中。我们对生产 IR 和较低环境中的 IR 有不同的名称。为了做到这一点,我们改名为 o...

回答 1 投票 0

通过 ADF 从一个驱动器读取数据

借助 Azure 数据工厂,可以从一个驱动器获取数据到 SQL 数据库 我正在尝试从一个驱动器(有多个文件夹)复制 Excel 文件,但没有内置

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.