etl 相关问题

ETL是Extract,Transform和Load的首字母缩写。它指的是从源系统提取数据,以某种方式转换数据(操纵它,过滤它,将其与其他源组合),最后将转换后的数据加载到目标系统的过程。

子查询为联接?

我的查询如下所示。从(...

回答 1 投票 0

如何在一列内生成多个总和?

[下面您可以看到我的查询,该查询提供以下结果:选择t.actual_date,t.id_key,t.attendance_status,t.money_step,sum(t.money_step)超过(按t.id_key顺序划分...

回答 1 投票 0

有条件地在Kubernetes集群的特定节点上启动Spring Cloud Task

我正在建立用于批处理的数据管道。而且我发现Spring Cloud Data Flow是一个非常吸引人的框架。没有对SCDF和Kubernetes的大量了解,我不确定是否...

回答 1 投票 0

将现有ID值分配给同一记录,将新ID分配给新记录

[我试图查看是否每次输入相同记录时都可以为名称分配ID。例如,如果我为ID Do001分配了ID E001,我希望能够将相同的值分配给John每次...

回答 1 投票 0

Power BI中通过HTTP GET进行REST API调用的任何更好的方法,以使用动态访问令牌(密钥)读取数据

[尝试使用REST API调用生成少量Power BI报告。这将需要首先生成一个“访问令牌”,然后将该密钥传递给各种API调用以进行身份 验证,以读取...

回答 1 投票 0

关于将数据放入数据仓库系统之前在何处转换数据的争论

我看到人们一直在谈论ETL或ELT,但这对我来说有点模糊。根据您的喜好,它可以是ETL或ELT。 ETL使用已建立的工具,例如Hadoop,Spark等...

回答 1 投票 -1

我们可以在Azure中自动化ETL吗?

我目前正在使用Azure进行一个非常有趣的ETL项目,以手动转换我的数据。但是,当我开始有多个源时,手动转换数据可能会很累且冗长...

回答 1 投票 0

避免写入pyspark数据帧中的NULL字段

我有一个带有以下条目的spark数据框column1 | column2“ a” | “ b”“ x” | “ c” null | “ a” null | “ b”“ x” | null因此,当我将其转换为胶粘动态框架时...

回答 1 投票 0

如何在不停机的情况下从RDBMS实时迁移到Mongo?

我正在使用仅支持RDBMS的软件。但是我需要将数据存储在MongoDB中。由于我没有该软件的源代码,因此我无法对其进行修改以支持MongoDB。所以我...

回答 2 投票 0

有效地创建一个大型的交互矩阵(数十亿到数万亿个单元)。 AWS Glue PySpark ETL

我正在尝试透视数据并生成用于建模的用户项交互矩阵。我一直将此作为AWS Glue Spark作业执行。在我的样本中,我有53,000个具有...

回答 1 投票 1

Data Lake:修复Ingestion与ETL上损坏的文件

目标我正在建立数据湖,总体流程类似于Nifi->存储-> ETL->存储->数据仓库。 Data Lake的一般规则听起来像在摄取阶段不进行任何预处理。全部...

回答 2 投票 2

我无法在SSIS连接管理器下拉列表中看到ODBC 64位驱动程序?

我在SSIS连接管理器下拉列表中看不到ODBC 64位驱动程序? Visual Studio 2017 SSIS项目中仅出现32位驱动程序。查看可用列表的任何解决方案...

回答 1 投票 0

从Azure SQL中非常嵌套的JSON中提取数据

我已嵌套JSON文件:“ vehicleStatusResponse”:{“ vehicleStatuses”:[{“ vin”:“ ABC1234567890”,“ triggerType”:{“ triggerType”:“ TIMER”,...

回答 1 投票 0

如何使用集中式SSIS数据流和模块化SSIS包

也许我对SSIS还是太陌生,或者还没有真正理解基本概念。但是我是一个喜欢重用的程序员。我们有几个SSIS项目,其中有很多事情...

回答 1 投票 0

BODS作业中Oracle的数据类型列中的无效日期格式

我正在使用SAP BODS,并且正在尝试使用SQL查询转换从ORACLE服务器中获取数据。现在,该表中有一个名为latest_changed_date的列,它是一个datetime列。我只想要...

回答 2 投票 0

时间戳列中Table_Comparison / Map_Operation中丢失的毫秒数

我在BODS(SAP Data Services)中有一个数据流,当我使用Table_Comparison / Map_Operation组合时,其中定义为datetime2的SQL Server列上的毫秒数被删除。当...

回答 1 投票 1

在BODS中进行MERGE语句

我有将SAP BODS作为ETL工具运行到Oracle Exadata。我想从BODS生成一个包含where子句的merge into语句,以限制在找到...

回答 1 投票 1

当AWS胶粘ETL作业中的glugContext.write_dynamic_frame.from_jdbc_conf返回错误时会发生什么?

假设我已经从s3存储桶中对文件进行了分类,并且由于主键冲突或其他原因而在RDS中插入记录时发生错误,我的ETL作业将停止处理吗? ...

回答 2 投票 0

Streamsets Data Collector:用其子值替换字段

我具有这样的数据结构{“ id”:926267,“ updated_sequence”:2304899,“ published_at”:{“ unix”:1589574240,“ text”:“ 2020-05-15 21:24:00 +0100 “,” iso_8601“:” 2020-05 -...

回答 1 投票 0

将Excel工作簿导入具有空行和列的SQL数据库

我有一个与要通过SSIS导入的发布图像相似的Excel工作簿。它具有特定的格式,例如空的列和行,因此在导入时,它具有很多NULL值。什么...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.