etl 相关问题

ETL是Extract,Transform和Load的首字母缩写。它指的是从源系统提取数据,以某种方式转换数据(操纵它,过滤它,将其与其他源组合),最后将转换后的数据加载到目标系统的过程。

如何使用 Python 从 Google Sheets 电子表格中仅获取新行?

假设我有一个包含数据的电子表格和一个手动启动的 Python 脚本,该脚本加载它并将其发送到 Google BigQuery。 假设在 11:00 我有 10 行,我的脚本读取它们并...

回答 1 投票 0

infer_schema 函数适用于缺少列标题的文件

目前,我已暂存 5 个文件,但都缺少一个列标题: 2021年 2022年 2023年 A组 54.9 55.3 55.7 B组 91.3 82.7 89.6 我无法更改这些文件的格式。我用的是

回答 1 投票 0

SSIS 错误 - 将数据加载到事实表 - 系统报告 80% 内存负载

我有以下包,以便将数据从维度加载到事实表: 当我执行这个包时,我收到以下错误: 错误:系统报告内存负载为 80%。那个...

回答 2 投票 0

如何从 Azure Databricks 对 Azure SQL Server 中的表执行更新插入操作?

这是一项 ETL 作业。因此,如果今天的数据已存在于目标表(在 Azure SQL Server 中)中,我需要用今天处理中的新记录替换现有记录。否则,插入...

回答 1 投票 0

有没有办法在 BigQuery 中访问 Google 我的商家数据?

我们正在开展一个项目,我们希望从众多“Google 我的商家”位置访问所有信息。我们希望通过 Google Analytics 数据访问 GMB 信息,并且

回答 3 投票 0

无法将连接项从 Talend 5.2(开源)迁移到 Talend Entreprise (8.0)

我们从免费版本(5.2.0)迁移到8.0,所以我必须将我的项目导入到新版本。但是,除了连接项目之外,所有项目都可以被新版本读取。 有没有人有

回答 0 投票 0

从长度为1024的描述列检索数据到长度为64的数据流“描述”列可能会发生截断

运行SSIS包时出现以下错误 由于从数据库列检索数据可能会发生截断 长度为1024的“描述”到数据流列“

回答 0 投票 0

SSIS 错误代码 DTS_E_OLEDBERROR。发生 OLE DB 错误。错误代码:0x80040E4D

嗨,我在远程服务器中执行 ssis 包时遇到以下错误。我在本地使用 Windows 身份验证,它工作正常,没有任何问题。我正在维护 package.config

回答 2 投票 0

Talend:如何确保带小数的数据应保留小数点后两位[关闭]

通过使用 Talend,我以字符串数据类型提取数字数据。我在确保所有带小数的字符串数据都位于小数点后两位时遇到问题。请参考样本数据...

回答 0 投票 0

Python Dagster - 如何使用增量刷新编写分区作业的计划?

我正在尝试使用 Dagster 来控制数据仓库项目的 ETL 流程,但是......我已经通读了文档并搜索了答案。看来调度程序无法支持增量刷新。喜欢

回答 0 投票 0

基于离散日期的连续累计计数

我有一张包含客户 ID 的表格,以及他们购买第一辆车、第二辆车、第三辆车和第四辆车的日期。 (有些客户可能没有四次购买,对他们来说,日期将是 2099 年,数据显示...

回答 0 投票 0

在 Azure SQL 数据库中提取 Salesforce 实时数据

我已使用 Azure 数据工厂从 Salesforce 将数据提取到我的 Azure SQL 数据库中。我已经完全设置了链接服务和数据集。我已经完全检查了从 Sales for 获取的数据...

回答 1 投票 0

首选 ELT/ETL 管道或 pg_backup 来备份 postgres 数据库有什么优势吗?

pg_backup 的优点是提供压缩备份。我们的备份也突然停止,因为某些进程请求访问独占锁。 ETL/ELT 管道具有增量选项。 除了...

回答 0 投票 0

在 MySQL 的 INT 列中可能发生的值是什么

我正在制作一个etl,我将使用MYSQL来存储时间序列数据。我有很多 int 列,我想知道是否有像 pandas 中的任何类型的 NaN 可能发生或者它唯一可能的 va ...

回答 0 投票 0

SQL BigQuery:查询作业执行日志

我正在尝试粗略估计我的 ETL 管道在每次执行以及每天的执行情况。我正在查询 BQ 工作历史并进行一些小的聚合以获得...

回答 0 投票 0

不同的映射条件

我正在做 ETL,我的主要数据流经数据块中的管道,我想将它与另一个文件合并,我在其中匹配来自两个数据集的 6 列。然而,其中一些专栏......

回答 0 投票 0

如何在DBT中设置profiles.yml和dbt_project.yml文件的位置?

运行 dbt debug --config-dir 显示不正确的位置。 例如。) 12:35:52 使用 dbt=1.0.3 运行 12:35:52 要查看您的 profiles.yml 文件,请运行: 打开/The/wrong/目录 我怎么告诉DBT...

回答 3 投票 0

我该如何解决? [关闭]

tdbCommit_1 错误:-参数(组件列表)为空,但它是必需的。人才开放工作室 在此处输入图片描述 d

etl
回答 0 投票 0

在 SQL 中去除非 X12 字符

我没有找到这个所以我想我会发布它。我需要一个函数来去除 X12 字段中不允许的字符。 允许的基本字符集: 大写字母 A B C D E F G H I J K L M N...

回答 0 投票 0

Excel 输入 Pentaho - 字符串到数字

我正在尝试在 Pentaho 中进行 xlsx 输入,但它一直给我这个错误信息: “将值 [v String] 转换为数字时发生意外转换错误” 我有一个值列......

回答 0 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.