etl 相关问题

ETL是Extract,Transform和Load的首字母缩写。它指的是从源系统提取数据,以某种方式转换数据(操纵它,过滤它,将其与其他源组合),最后将转换后的数据加载到目标系统的过程。

为什么即使分支操作符返回其任务 ID,此 DAG 也会跳过任务?

我在 Airflow 中有以下 DAG: validate_and_prepare_config>>skip_detect_task>>[摄取,检测] 检测>>导出 摄取>>skip_decrypt_task>>[d...

回答 1 投票 0

比较行以仅发送 Informatica 中的特定行

我需要有关如何在 informatica powercenter 中解决以下问题的指导。 我的源平面文件。 |学生|主题|PF| |1|科学|失败| |1|数学|及格| |2|科学|失败| 我需要应用逻辑,如果 a

回答 1 投票 0

数据转换非常棘手的问题

我想根据以下规则选择数据并添加一个名为“检查”的新列: 对于每个“consumer”列,如果消费者没有 master_consumer 值(在

回答 1 投票 0

SQL Server 数据转换非常棘手的问题

我想根据以下规则选择数据并添加一个名为“检查”的新列: 对于每个“consumer”列,如果消费者没有 master_consumer 值(在

回答 1 投票 0

SSIS ForEach 循环未迭代文件夹中的所有项目

我在一个文件夹中有 4 个 Excel 文件。 2 个有同名的单页,另外 2 个各有 2 张(我想要的数据具有相同名称的工作表)。 我在 SSIS 中使用了 ForEach 循环来...

回答 1 投票 0

验证增量更新插入数据

我正在从 Salesforce 读取数据,使用 pyspark SQL 和 ADF 管道执行增量更新插入...我想在更新插入发生时验证源和目标之间的数据,我怎样才能实现...

回答 1 投票 0

Apache Airflow 多用户环境

我正在尝试为我的数据工程团队创建一个系统或环境。 要求是: 它必须在本地托管。 它应该有调度。 用户应该能够编写代码

回答 1 投票 0

AB Initio 中串行文件和多文件的区别

Ab Initio 中的串行文件和多文件有什么区别?

回答 3 投票 0

避免 Spark 数据框中的惰性求值

我有文件列表,我对它们执行以下操作 导入 org.apache.spark.sql.*; 为(文件文件:文件){ df = Spark.read.csv(文件) df = df.withColumn("last_update_date",

回答 1 投票 0

Pentaho ETL 与 postgreSQL

我正在使用 Pentaho 进行 ETL,其中使用了多个转换以及执行这些转换的作业。但是当过程中出现错误时,之前没有进行的转换...

回答 1 投票 0

SSIS 错误:找不到列“columnX”的分隔符

这个问题之前曾在这里被问过,但提出的解决方案似乎对我不起作用。 我正在尝试导入一个文本文件管道分隔文本限定符“。SSIS 包正在返回...

回答 9 投票 0

无法让 SSIS 脚本任务工作

我觉得我缺少一些配置或其他东西,因为我已经遵循了大量的在线教程,但无法获得任何脚本任务的示例。我无法调试错误,要么是...

回答 4 投票 0

错误:0x1 at XX:调用目标已引发异常

我正在尝试使用 SSIS 中的 C# 任务脚本将文件从 FTP 服务器复制到本地驱动器。该脚本在 SQL Studio 2008 R2 中运行良好,但是使用 SQL SSDT (SQL Ser...

回答 1 投票 0

调用目标已引发异常 - SSIS 脚本任务错误

我有以下脚本任务,使用 C# 刷新 SSIS 包中 Excel 中的数据透视表。该包在 Visual Studio 以及包实用程序中运行良好。但是当我部署这个

回答 2 投票 0

Python中批量加载数据问题

我想使用pandas将数据批量加载到雪花仓库中。请在下面找到完整的要求: 我在雪花表中有源数据。我在数据框中阅读相同的内容。 加载后...

回答 1 投票 0

当 Pentaho 无法进行转换时发送电子邮件

我在Pentaho中为DW构建了一个ETL结构,但是,我们使用不稳定的OLTP数据库作为源,所以有时作业中可能会发生错误(因为数据库关闭)。 我需要创造一份工作...

回答 1 投票 0

Informatica 新列数据加载到现有目标表中

我有一个要求,因为有一个现有的目标表,现在的要求是我们已在其中包含一个新列,并且目标表的数据应从新的新源表加载

回答 1 投票 0

Pentaho 数据集成:“group by”与用“;”分隔的连接字符串而不是“,”

我必须连接来自不同字段的字符串。输出应该是字段中用分号分隔的所有字符串。 “分组依据”转换步骤完成了我需要做的一切,但我可以

回答 2 投票 0

S3 文件传输和 Glue ETL

我目前在一家新公司实习,担任数据工程师,在第一个任务中遇到了一些挑战。希望有经验的朋友能够提供一些指导

回答 1 投票 0

在列表上使用BeautifulSoup而不丢失url属性

我已经成功地抓取了所有 li 的页面并创建了一个数据框。我遇到困难的部分是提取并保留每行中的“url_for_rowN”部分。我想要...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.