etl 相关问题

ETL是Extract,Transform和Load的首字母缩写。它指的是从源系统提取数据,以某种方式转换数据(操纵它,过滤它,将其与其他源组合),最后将转换后的数据加载到目标系统的过程。

用于处理多个流的库

我需要有关构建应用程序的建议,该应用程序将: 连接到内容类型流:文本/事件流 可以有 1+ 个流(所有流都具有相同的数据模型) 聚合传入消息...

回答 0 投票 0

将 SQL 地理类型列加载到 Vertica 时出错

我试图将浮点类型的纬度和经度列转换为 SQL 中的地理类型,然后将它们加载到 Vertica 表中。 我使用以下代码将列转换为

回答 1 投票 0

如何获取地图,并将它们的键组合成地图向量?

我有这样的数据: [{:a [{0 0} {2 2} {9 9}]} {:b [{2 2} {5 6} {7 7}]} {:c [{0 1} {5 5} {5 3}]}] 我想把它变成这样: [{:a {0 0} :b {2 2...

回答 3 投票 0

在 ADF 中参数化 IR 名称

我需要在部署期间将 IR 名称作为参数传递到 ADF 模板中。我们对生产 IR 和较低环境中的 IR 有不同的名称。为了做到这一点,我们改名为 o...

回答 1 投票 0

通过 ADF 从一个驱动器读取数据

借助 Azure 数据工厂,可以从一个驱动器获取数据到 SQL 数据库 我正在尝试从一个驱动器(有多个文件夹)复制 Excel 文件,但没有内置

回答 1 投票 0

SQL Server 是否可以在 Azure Synapse 中用作模式漂移的接收器?

我的工作负载具有高度可变的架构。我已经成功地将它以 CDM 格式加载到 ADLS 中,并且能够从我的数据流中访问数据并写回 CSV。 当试图...

回答 1 投票 0

验证数据完整性 ETL

目前所有数据库数据都从 SQL/Oracle 迁移到雪花(即仅提取和加载),基本上是数据的副本,以便稍后我们可以修改数据,Power Bi 可以从中获取

回答 0 投票 0

自动 API 转换 [关闭]

我有一个系统,我们要求我们的客户根据我们定义的模式托管一些 API,这样一旦完成,我们就不必为每个客户编写任何自定义代码,因为他们已经按照我们的标准进行了编码......

回答 0 投票 0

从 SurveyMonkey 获取增量数据应用 Rest API

出于分析目的,我希望使用其 Rest API 从 SurveyMonkey Apply 中提取增量数据。我将要使用的一些端点是 Activity、Users、Programs 和 Applications……

回答 0 投票 0

使用 SSIS 中的“Active Directory 密码”连接 Azure DB

使用 visual studio 2022,我想通过 Active Directory 密码连接到 Azure - Dynamics CRM 数据库。 我使用 ADO.NET 选项配置了一个新连接,当我单击“测试连接&...

回答 0 投票 0

SSIS - 每 6 天出现一次 OData 连接问题

我有一个预定的 JOB(SSIS 包),它使用 OData Connection 从 Sharepoint Online 列表加载数据。 它在 IDE 中运行,部署后可在服务器上运行 5 天。之后我得到了

回答 0 投票 0

如果根据年/月/日进行分区,则在两个日期范围之间下推谓词

我正在尝试查询分区为年/月/日的 Glue 目录中的记录,这是我的代码: query = f"""(year BETWEEN '{start.year}' AND '{end.year}') AND (month BETWEEN '{...

回答 0 投票 0

Pentaho PDI 克隆之前的值

]嗨,遇到问题,还不知道如何正确解决。我有一列包含 3 个值,它们之间有空单元格。我需要用之前的

回答 1 投票 0

如何聚合 IBM InfoSphere DataStage 中按给定 ID 分组的多行中的字符串

我得到了一张公司员工出勤表,如下所示。数据应从具有逗号分隔值的顺序文件中提取。 ID 工作日 考勤 1个 周一...

回答 1 投票 0

我在 SSIS 包中遇到了一些错误,我正在加载数据

这些是错误。 [加载 FactTitlesAuthors [27]] 错误:SSIS 错误代码 DTS_E_OLEDBERROR。发生 OLE DB 错误。错误代码:0x80040E21。 OLE DB 记录可用。资料来源:“

回答 1 投票 0

git模式无法删除Azure数据工厂中的数据流

我有一个必须删除的 Azure 数据工厂数据流。我必须这样做,因为为了发布我最新的数据工厂更改,我需要清除对此数据流的验证。然而,我不能

回答 1 投票 0

如何执行将多个 py 文件压缩为 zip 的 ETL 作业?

您将如何在 AWS Glue 中运行 ETL 作业,其中 .py 文件被压缩为 zip,py_files.zip? 配置.json 初始化文件 转换.py udfs.py 输出.py 主程序 主程序 从初始化 ...

回答 0 投票 0

如何在sql中将类似的情况放在一行中,将不同的情况放在不同的行中?

我有两张学生表,表1有个人信息,表2有他在学校借书次数的附加信息。 表格1: * doc_part1: id 第 1 部分 * doc_part2: id 部分...

回答 0 投票 0

从 BigQuery 中提取数据并加载到 SQL Server 中的最佳方法是什么?

我想创建一些通用管道,我可以在其中传递表名或自定义 SQL 作为输入,并将所需数据从 BigQuery 加载到 SQL Server。该管道应处理每日增量负载...

回答 1 投票 0

用于字符串操作的 Nifi jolt 变换

我有一个 json 文档,我需要对其应用 jolt 转换,感谢任何帮助。 这是我的 json 文档。 { "name": "酒商1", “in_stock”:“3 ...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.