pdi 相关问题

PDI Pentaho的数据集成,也称为Kettle,提供提取,转换和加载(ETL)功能。

如何使用 PDI 将 blob 文件写入本地文件系统?

我有一个转换,我使用 RESTClient 步骤将原始应用程序/八位字节流读入流字段,该步骤工作正常。现在,我想将(*.jpg)文件写入l...

回答 1 投票 0

Pentaho PDI || Windows 当前用户

PDI版本:9.3 环境:Windows服务器 我正在尝试检索执行转换的当前用户的用户名,目的是基于该用户创建动态文件路径

回答 1 投票 0

将带有元列的 XML 转换为 PDI 中的 csv

我有以下 XML 结构作为输入(列/字段和行数可以根据查询进行更改) 我有以下 XML 结构作为输入(列/字段和行数可以根据查询进行更改) <?xml version="1.0" encoding="UTF-8"?> <response> <results> <metadata> <column name="item" type="S" length="255"/> <column name="client" type="S" length="255"/> </metadata> <data> <row> <field>ACME-ITEM-01</field> <field>ACME</field> </row> </data> </results> </response> 我想使用 Pentaho Data Integration PDI(又名 Kettle)或 Apache HOP 将其转换为 CSV 文件。 做到这一点的最佳方法是什么? 我在 PDI 中解析 XML 文件没有问题,其中每个段都有自己的名称,但在这里我正在用头撞墙。 刚刚发现这正是元数据注入步骤的目的。

回答 1 投票 0

Pentaho Data Integration V7 中的通道日志表问题:在手动执行中有效,但在夜间批处理中无效

在Pentaho Data Integration(V7)中,我们激活了Kettle自己的日志表来生成错误报告系统。到目前为止,我们已经激活了Job、Transformation和Channel日志表: 在...

回答 1 投票 0

Pentaho:文件夹中的多个excel到一个excel

我已成功从文件夹中输入多个 Microsoft Excel 文件。如何将所有这些数据保存到一个 Excel 文件中? 参考输入:https://stackoverflow.com/a/66865749/23392458 我想要所有 Excel

回答 1 投票 0

如何将信任存储与pentaho数据集成/Rest客户端一起使用?

我正在使用 Pentaho 数据集成(Kettle)。我的目标是通过 HTTPS 使用现有的 REST API。为了实现这一点,我使用 pdi 提供的 REST 客户端。 在我当地的环境中,我能够...

回答 2 投票 0

如何在PDI中循环日期变量?

所以我有一份工作,第一个转换步骤是“声明日期变量” 我需要使用 2 个日期变量作为范围来创建 date_from 和今天之间的循环(7 天范围) 是...

回答 1 投票 0

如何在 Pentaho Data Integrator 中使用 mongodb 函数 gettimestamp() 提取 ObjectId 到时间戳

我正在尝试修改 Pentaho 上的 ETL 流程,即 mongodb 到 oracle。我想将其更改为增量流,因此我需要一个创建日期。 在 mongodb 中有一个名为 _id 的列,其中包含 ObjectId...

回答 1 投票 0

中止pentaho中的作业,日志中没有错误消息

一些背景。我们有一个父作业,它调用一个转换,最终从服务中检索并处理 XML 文件,然后确定...

回答 1 投票 0

使用 PDI Pentaho 中的表名称获取转换详细信息

我知道我的数据库表名称,它正在作业内的 Pentaho PDI 转换中的一个转换中使用。但我不知道同一张桌子还用在其他地方

回答 1 投票 0

如何使用 Pentaho Spoon 6 JSON 输入读取多层嵌套 JSON 文件

我有一个包含多个子级别的 JSON 文件,需要使用 PDI 进行解析。让我陷入困境的棘手之处是嵌套数组中的一对多关系。 这是我的 J...

回答 1 投票 0

通过命令行在Carte服务器上运行Pentaho作业或转换

我需要通过命令行调用jobs/trans来运行,因此我使用pan.sh和kitchen.sh来触发它们运行。 然而,每当它被触发时,它都会创建一个单独的 JVM。我正在考虑...

回答 1 投票 0

通过命令行在 Certe Server 上运行 Pentaho 作业或转换

我需要通过命令行调用jobs/trans来运行,因此我使用pan.sh和kitchen.sh来触发它们运行。 然而,每当它被触发时,它都会创建一个单独的 JVM。我正在考虑...

回答 1 投票 0

无法在 Pentaho Data Integration 9.2 中运行作业(kjb)

我尝试使用pentaho 9.2运行作业,但在按厨房评论运行时没有选择作业 ./kitchen.sh -rep=repo1 -file=/var/lib/jenkins/project/path/etl/Job1.kjb Job1.kjb 包含多个...

回答 2 投票 0

如何提高pentaho变换输入/输出速度

我正在使用 Pentaho 数据集成 (PDI)-spoon 来创建 ETL,并且我非常关注性能。 我开发了一个 ETL 来处理 MySQL 8 中的 2,500,000 行副本(每行有 104 列)...

回答 2 投票 0

Pentaho 数据集成:将文本转换为数字(Rhino)

我正在使用Pentaho数据集成,我需要将名为“密度”的变量中的字符串值内容转换为数值。 例如,如果密度=“6.5”,我需要转换...

回答 1 投票 0

如何使用 python 脚本更改 Pentaho 中的数据库连接变量?

在将转换从一个环境复制到另一个环境时,我试图尽量减少工作量。目前,从开发环境切换时,我们必须手动更改每个数据库连接变量...

回答 0 投票 0

Pentaho CE 6.1 到 CE 8.1 升级 - 项目失败

我正在尝试使用一个父 .ktr 和一些子转换(子 .ktr)运行一个转换。在原始 PDI 6.1 上运行时,所有地图都可以成功运行。在升级版本上运行时...

回答 0 投票 0

Pentaho PDI 克隆之前的值

]嗨,遇到问题,还不知道如何正确解决。我有一列包含 3 个值,它们之间有空单元格。我需要用之前的

回答 1 投票 0

pentaho spoon/pid:如何每次将文件移动到不同名称的文件夹?

我每个月都有新的文本文件,我从中提取数据并进行一些转换。在每个月底,我需要将这些文件移动到名称为当前日期的文件夹中。这意味着...

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.