etl 相关问题

ETL是Extract,Transform和Load的首字母缩写。它指的是从源系统提取数据,以某种方式转换数据(操纵它,过滤它,将其与其他源组合),最后将转换后的数据加载到目标系统的过程。

SSIS删除管道中多余的列

有人知道是否仍然无法从管道/数据流中删除(而不是隐藏)未使用或冗余的列?好吧,我想可以选择删除列或只是

回答 2 投票 0

将数据从 API 加载到 BigQuery 的首选方式是什么?

我正在尝试将数据从 REST API 获取到 Google Cloud Platform (GCP) 上的 BigQuery 中。实现这一目标的最佳方法是什么(不使用任何第三方工具,例如 Funnel.io 或 Supermetrics)?

回答 2 投票 0

使用 Python ETL (petl) 创建 ETL 管道

我有一个相对直接的 ETL 任务: 读取存储在存储桶 (S3) 中的 CSV 中提供的客户数据。 将数据解析/转换为可用的查询。 最后,将其加载到 postgre...

回答 1 投票 0

无法使用 Glue 将数据从 s3 插入到 DDB

从 s3 读取数据后将数据写入 DDB 时,失败并出现以下错误: 错误类别:UNCCLASSIFIED_ERROR;调用 o112.pyWriteDynamicFrame 时发生错误。提供...

回答 1 投票 0

Python 包构建 SQL 查询

我正在构建一个 ETL,但是,我有一个限制: 我必须使用常规 HTTP 请求与数据库进行通信(将 SQL 查询作为字符串发送)。 我正在寻找可以帮助我的软件包和工具...

回答 1 投票 0

直接将雪花 dwh 中的表加载到 postgreSQL 数据库中

我正在尝试编写一些Python脚本,这些脚本将获取我在雪花中的表并将它们传输到postgreSQL数据库。我必须将雪花表中的每一行转换为 json 字符串,所以在

回答 1 投票 0

SSIS 条件拆分错误 - 表达式计算结果为 NULL,但“条件拆分”需要布尔结果

这是我第一次使用这个软件。我正在尝试拆分该值,但它显示了这一点,当我看到我的源时,我没有任何 null 值,但当我预览它时,它在...

回答 2 投票 0

将 Excel 表格列(并非全部)转换为行 - 长到宽的转换

需要将Excel表格的列转换为行。我尝试将数据透视表的值转换为文本,但找不到用其基础数据替换值字段的方法(显示为 te...

回答 1 投票 0

是否可以将 OleDbConnections 与脚本组件一起使用?

我正在构建一个 ssis 包,我希望在脚本组件内使用现有的 OleDbConnection。这是我的代码: 公共覆盖无效AcquireConnections(对象事务) { 基地。

回答 3 投票 0

将数据从一个环境中的一个模式导入/导出到 postgres 中的另一个环境

由于数据方面的挑战及其当前的情况,需要对某些表以自动方式将数据从较高的环境导出到较低的环境。 寻找批量导出的任何建议/

回答 1 投票 0

Abinitio 显式不动点

我的 abinitio ETL 代码中有一个 DDL,如下所示, 十进制 (“\x01”.6) AMOUNT = NULL (“”) 这是什么意思?是四舍五入到小数点后 6 位还是截断到小数点后 6 位? 例如,123.4567889 = 123.456788...

回答 1 投票 0

在什么情况下我必须在informatica powercenter中使用转换而不是sql查询?

如果我可以通过写SQL来实现,是不是就不需要使用转换组件了?我想知道在什么情况下使用转换比 sql 查询更好?我听说隐藏了

回答 2 投票 0

AWS Glue Python 作业 VS AWS Glue Spark 作业

我有一个用例,我必须创建一个 AWS Glue ETL 作业以将 S3 对象中存储的数据更新到 DDB 中的现有表。需要考虑的几个属性是: 目前数据集约为 40...

回答 1 投票 0

ETL中截断加载和满载一样吗?

截断加载和完全加载对于目标表中的数据加载有什么区别?

回答 1 投票 0

从 Azure 数据工厂中的整个文件读取非结构化文本

我有一个文件,在 ADLS 中以非结构化 txt 形式存在。我想以文本形式读取整个文件内容并将其传递到 Azure 数据工厂中的存储过程。这可以通过 Azure 来完成吗...

回答 1 投票 0

如何根据文件夹 F2 中是否存在其内容来复制文件夹 F1 中的 XML 文件(忽略文件名)

我们已经为我们运行的其他进程准备了一个 Azure 数据工厂,因此正在尝试使用它来解决以下问题: 我们已经拥有的: ADF 已部署并运行,我们只需创建一个...

回答 1 投票 0

SSIS 输出和 SSMS 输出中的数据大小差异

我有一个 SSIS 包,它使用 SQL 命令从数据库中提取数据,然后生成 1452kb 的分隔文本文件 我在 SSMS 上运行相同的查询并生成文本文件 1499...

回答 2 投票 0

在SSIS中如何访问运行OLE DB命令的结果?

我在 Visual Studio 2010 中使用 SSIS。我的包如下所示: OLE DB 源 -> 多播 -> 7 个 OLE DB 命令 上述七个 OLE DB 命令中的第六个包含: 选择 r.Device...

回答 4 投票 0

从 Snowflake 内部连接到本地数据库

可以直接从 Snowflake 建立与本地数据库(例如 Sybase)的连接,还是需要在 Snowflake 外部建立连接?例如,我知道我可以在某些 AWS 合作伙伴中连接到我的数据库...

回答 1 投票 0

使用 ETL 工具 (Fivetran/Hevo)、dbt 和反向 ETL 工具 (Hightouch) 创建顺序工作流程

我在一家初创公司工作,正在从头开始建立我们的分析技术堆栈。由于资源有限,我们专注于使用第三方工具而不是构建自定义管道。 我们的

回答 4 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.