etl 相关问题

ETL是Extract,Transform和Load的首字母缩写。它指的是从源系统提取数据,以某种方式转换数据(操纵它,过滤它,将其与其他源组合),最后将转换后的数据加载到目标系统的过程。

AWS 胶水 ETL 作业-我希望我的函数将空值转换为“null”,当在键中时,存在任何数据类型,我想删除该键

def handle_data_type_recursive(rec): new_dict = {} 如果是实例(rec,dict): 对于键,rec.items() 中的值: 如果是实例(值,字典): 结果 =

回答 0 投票 0

取决于一个名为“energy_dbt_model”的节点,该节点未找到

嘿,我是 dbt 的新手,正在尝试找出如何查询我的 duckdb 文件。但是当我运行 dbt run --select energy_dbt_model 时。我不断收到错误模型 'model.transform_dbt.first_model' (m...

回答 0 投票 0

如何使用 SISS 将列添加到平面文件?

我有一个 SISS 包,我在其中获取 .csv 文件并将它们加载到数据库中,然后我有一个带有 SQL 语句的任务来获取我需要的数据并将其导出到 .csv 文件中。我需要将列添加到 ...

回答 1 投票 0

是否可以使用外部 API 创建和编辑 Celery 计划的任务?

我想开发一个系统,允许最终用户通过一个应该集成到现有软件中的界面来创建、编辑和删除数据管道。这些数据管道

回答 0 投票 0

从地图中,我如何按顺序对序列的元素(值)进行分组?

我有一张代表数据库的地图。键是字段,值是事务。值的顺序很重要;第一个元素是交易,第二个元素是第二个

回答 2 投票 0

AWS Glue Stufio 作业重新处理 - AWS ETL 管道

我的 AWS ETL 管道过程是 我有一个现有的 S3 存储桶和对象,其中包含原始文件,每天从我们的 sftp 服务器上传 s3://my-bucket/raw_data/2022/202201/20220101/file.csv.gz s3://我的-

回答 0 投票 0

SSIS 脚本突然无法构建

我有一个脚本可以根据两个变量创建一个目录誓言。当脚本突然停止构建时,我正试图对其进行故障排除。 首先,有一个只读变量提供...

回答 2 投票 0

将数据从 SAP 传输到 SQL Server 的最佳方式是什么?

我们希望基于 SAP 表从头开始构建一个新的数据仓库。对于提取、转换和加载 (ETL) 过程,我们希望使用 Microsoft SQL Server Integration Services。有...

回答 3 投票 0

如何对多个数据帧使用 pandas .head() 函数?

我想同时检查下面数据帧的头部,而不重复 .head() 3x。 ride_sharing = pd.read_csv('datasets/ride_sharing_new.csv', index_col = '未命名: 0') 航空公司 = pd.

回答 3 投票 0

SSIS:独立重新运行失败的子包而不会使主包失败

我们在 SSIS 中设置了一个主包,负责运行 35 个子包(在主包内)。主包运行时间表是从上午 9 点到下午 5 点。如果所有子包...

回答 0 投票 0

使用 DataFusion 从 BigQuery 到 GCP 中的 Bucket

目前我有一个 BigQuery 表,我想将其传输到 GCP 存储桶中的 CSV 字段,这就是我目前所拥有的。 当我部署管道并在存储桶中看到结果时,

回答 0 投票 0

software.amazon.awssdk.services.s3.model.S3Exception: null (Service: S3, Status Code: 400)?

我正在尝试将 s3 数据湖添加为 Fivetran 中的一个 ETL 工具的目的地。为此,我创建了一个具有 s3 和胶水访问权限的角色,由另一个 aws 帐户用户 (fivetran) 访问。我可以连接...

回答 1 投票 0

将数百万条记录从 Postgres DB 转移到另一个 Postgres,选择结果是随机的

我需要构建一个 API,将包含数百万条记录的 Postgres 查询数据传输到另一个 Postgres 数据库 源托管在 Azure 上,而 Postgres 在 Prem 上。 我试过了

回答 0 投票 0

用一个粘合作业运行多个脚本

是否有可能让一个粘合作业在每次调用时运行不同的脚本文件,具体取决于在触发它时传递给粘合作业的参数?

回答 0 投票 0

从 XML 加载数据到 SQL Server 数据库时出现 SSIS 错误

从 XML 文件加载数据到 SQL Server 数据库时出现以下错误。数据库在我的本地机器上。 [XML 源 [41]] 错误:“XML 源”失败,因为

回答 0 投票 0

使用 PL/SQL 函数和 ETL 触发器更好,还是使用像 Talend 这样的 ETL 软件更好

我有一个带有两个模式 A 和 B 的 Postgresql 表,我需要将数据从 A.Table 传输和注入到 B.Table。 什么是更好的选择:使用 PL/SQL 函数或使用 Talend PS:桌子可以...

回答 0 投票 0

如何使用ETLBox框架?

Req:我有 4 个不同的数据源(2 个 Mysql,2 个 SQL Server),我需要每天从所有这些数据源中获取一次数据,然后转换数据并将其推送到目的地(API)。 如果你...

回答 0 投票 0

如何在本地 VS Code 中构建和测试 AWS glue ETL spark 代码?

我是 AWS Glue 的新手,我被分配创建一个 AWS Glue ETL 作业。我们的项目中只有 AWS Prod Environment。我想知道如何设置我的 VS Code IDE,以便我可以构建和测试...

回答 0 投票 0

在 Oracle 中处理 5000 万条记录的更快方法

我正在尝试对 Oracle 中的 6000 万条记录进行 CDC。 我需要根据目标 (TABLE) 检查 6000 万条源 (TABLE_TEMP) 记录,并执行插入、更新或软删除操作。 我试着...

回答 0 投票 0

分隔符问题 - 将数据从 Azure SQL 复制到 Snowflake

我正在尝试将数据从 Azure SQL 加载到 Snowflake。我只能使用复制活动。 我正在使用查找表来引用具有源模式源的元数据表 source

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.