etl 相关问题

ETL是Extract,Transform和Load的首字母缩写。它指的是从源系统提取数据,以某种方式转换数据(操纵它,过滤它,将其与其他源组合),最后将转换后的数据加载到目标系统的过程。

SSIS 输出和 SSMS 输出中的数据大小差异

我有一个 SSIS 包,它使用 SQL 命令从数据库中提取数据,然后生成 1452kb 的分隔文本文件 我在 SSMS 上运行相同的查询并生成文本文件 1499...

回答 2 投票 0

在SSIS中如何访问运行OLE DB命令的结果?

我在 Visual Studio 2010 中使用 SSIS。我的包如下所示: OLE DB 源 -> 多播 -> 7 个 OLE DB 命令 上述七个 OLE DB 命令中的第六个包含: 选择 r.Device...

回答 4 投票 0

从 Snowflake 内部连接到本地数据库

可以直接从 Snowflake 建立与本地数据库(例如 Sybase)的连接,还是需要在 Snowflake 外部建立连接?例如,我知道我可以在某些 AWS 合作伙伴中连接到我的数据库...

回答 1 投票 0

使用 ETL 工具 (Fivetran/Hevo)、dbt 和反向 ETL 工具 (Hightouch) 创建顺序工作流程

我在一家初创公司工作,正在从头开始建立我们的分析技术堆栈。由于资源有限,我们专注于使用第三方工具而不是构建自定义管道。 我们的

回答 4 投票 0

SSIS 从 csv 中删除 $ 格式

我有一个 csv 文件,其中包含多个格式为货币的列,删除格式但保留值的最佳方法是什么。如果可能的话,我希望使该过程自动化。 我...

回答 1 投票 0

元数据驱动的 ADF 管道从多个源获取数据

我正在设计 ADF 解决方案以从 DataLake 原始层读取多个源文件夹,我需要构建一个配置文件,在其中可以动态管理要加载的文件/文件夹以及要加载的日期范围 我....

回答 1 投票 0

如何将连接管理器嵌入到 SSIS 脚本组件的 C# 代码中?

当我打开脚本组件时,我可以从下拉列表中选择连接管理器: 这个连接管理器拥有一切,如果我将它作为 C# 代码中的对象,我就不需要编写一个 har...

回答 4 投票 0

如何在 C# 代码中嵌入可为脚本组件选择的连接管理器?

我应该如何在 SSIS 数据流任务的“脚本组件”中使用连接管理器。我尝试使用带有 OLEDB 提供程序和 SQL 的连接管理器,但失败了。什么是正确的方法...

回答 4 投票 0

生成ETL过程的数据流图

我想为 ETL 流程生成类似数据流程图的内容。 我想要实现的是拥有(最小的示例)两个表 - 源表和目标表 - 两个表都带有

回答 1 投票 0

Pentaho PDI || Windows 当前用户

PDI版本:9.3 环境:Windows服务器 我正在尝试检索执行转换的当前用户的用户名,目的是基于该用户创建动态文件路径

回答 1 投票 0

AWS Glue Crawler 在读取空文件时创建多个表

我正在编写一个 Glue Crawler 作为 ETL 的一部分,我有一个非常烦人的问题 - 我正在爬取的 S3 存储桶包含许多不同的 JSON 文件,所有文件都具有相同的架构。当爬行桶时...

回答 1 投票 0

AWS Glue 工作室将 Pyspark 字符串列转换为日期返回 null

我有来自 S3 存储桶的数据,并且想要将日期列从字符串转换为日期。当前日期列的格式为 7/1/2022 12:0:15 AM。 我在 AWS Glue Studio 中使用的当前代码...

回答 3 投票 0

我如何在 Gathr 中请求连接器

我是 ETL 开发人员,正在寻找 Gathr 中不可用的数据源连接器,并且我不知道如何请求新的连接器。现在,由于

回答 1 投票 0

Gathr 企业版如何将管道从开发环境导出到生产环境?

我是生产新手,正在尝试导入开发团队提供的管道。 我还没试过。如果有类似的问题,我希望首先在在线平台上得到答案

etl
回答 1 投票 0

我正在使用 Gathr 构建我的 ETL,我想在将源数据存储到目标中之前更改源数据的列名称。有没有办法实现这个目标?

我正在使用 Gathr 构建我的 ETL 流程,我想在将源数据存储到目标中之前更改源数据的列名称。有办法实现这一点吗? 我不知道如何更改列 n...

etl
回答 1 投票 0

SSIS 包执行在完成之前停止

今天遇到一个bug,分享给大家。 当尝试在 Visual Studio(2015 和 2017)中执行 SSIS 包时,可能会发生以下情况(请注意此包已执行

回答 5 投票 0

如何将我的 PostgreSQL 数据 ETL 到 ClickHouse 数据仓库中?

我将数据存储在postgreSQL作为数据源,我想加载clickhouse数据仓库的维度和事实表,我是clickhouse的新手,习惯使用传统的集成工具...

回答 4 投票 0

我有两个不同的来源来读取和处理数据。我可以在单个 Gathr Pipelines 中读取这些源代码吗?

我有两个不同的来源来读取和处理数据。我可以在单个 Gathr Pipelines 中读取这些源吗? 我尝试在管道中添加一个源,但不确定是否可以添加多个

etl
回答 1 投票 0

Apache Spark 在 ETL 大数据生态系统中处于什么位置?有人可以用例子解释一下吗?

我正在尝试使用 Spark 在大数据生态系统上创建 ETL 管道。但管理和创建这些管道面临着多种复杂性问题。我将不胜感激任何更简单的解决方案来实现......

etl
回答 1 投票 0

我正在加载一个以管道作为分隔符的 CSV 文件,该文件位于 blob 位置,并使用突触管道中的 SP 活动将其加载到临时表

管道是元数据驱动的 错误消息是 '[昨天 22:20] mruti Ranjan Dehury 代码”:21104,“消息”:“ErrorCode=DelimitedTextMoreColumnsThanDefined,'T...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.