PDI Pentaho的数据集成,也称为Kettle,提供提取,转换和加载(ETL)功能。
我有一个转换,我使用 RESTClient 步骤将原始应用程序/八位字节流读入流字段,该步骤工作正常。现在,我想将(*.jpg)文件写入l...
PDI版本:9.3 环境:Windows服务器 我正在尝试检索执行转换的当前用户的用户名,目的是基于该用户创建动态文件路径
我有以下 XML 结构作为输入(列/字段和行数可以根据查询进行更改) 我有以下 XML 结构作为输入(列/字段和行数可以根据查询进行更改) <?xml version="1.0" encoding="UTF-8"?> <response> <results> <metadata> <column name="item" type="S" length="255"/> <column name="client" type="S" length="255"/> </metadata> <data> <row> <field>ACME-ITEM-01</field> <field>ACME</field> </row> </data> </results> </response> 我想使用 Pentaho Data Integration PDI(又名 Kettle)或 Apache HOP 将其转换为 CSV 文件。 做到这一点的最佳方法是什么? 我在 PDI 中解析 XML 文件没有问题,其中每个段都有自己的名称,但在这里我正在用头撞墙。 刚刚发现这正是元数据注入步骤的目的。
Pentaho Data Integration V7 中的通道日志表问题:在手动执行中有效,但在夜间批处理中无效
在Pentaho Data Integration(V7)中,我们激活了Kettle自己的日志表来生成错误报告系统。到目前为止,我们已经激活了Job、Transformation和Channel日志表: 在...
我已成功从文件夹中输入多个 Microsoft Excel 文件。如何将所有这些数据保存到一个 Excel 文件中? 参考输入:https://stackoverflow.com/a/66865749/23392458 我想要所有 Excel
如何将信任存储与pentaho数据集成/Rest客户端一起使用?
我正在使用 Pentaho 数据集成(Kettle)。我的目标是通过 HTTPS 使用现有的 REST API。为了实现这一点,我使用 pdi 提供的 REST 客户端。 在我当地的环境中,我能够...
所以我有一份工作,第一个转换步骤是“声明日期变量” 我需要使用 2 个日期变量作为范围来创建 date_from 和今天之间的循环(7 天范围) 是...
如何在 Pentaho Data Integrator 中使用 mongodb 函数 gettimestamp() 提取 ObjectId 到时间戳
我正在尝试修改 Pentaho 上的 ETL 流程,即 mongodb 到 oracle。我想将其更改为增量流,因此我需要一个创建日期。 在 mongodb 中有一个名为 _id 的列,其中包含 ObjectId...
我知道我的数据库表名称,它正在作业内的 Pentaho PDI 转换中的一个转换中使用。但我不知道同一张桌子还用在其他地方
如何使用 Pentaho Spoon 6 JSON 输入读取多层嵌套 JSON 文件
我有一个包含多个子级别的 JSON 文件,需要使用 PDI 进行解析。让我陷入困境的棘手之处是嵌套数组中的一对多关系。 这是我的 J...
我需要通过命令行调用jobs/trans来运行,因此我使用pan.sh和kitchen.sh来触发它们运行。 然而,每当它被触发时,它都会创建一个单独的 JVM。我正在考虑...
通过命令行在 Certe Server 上运行 Pentaho 作业或转换
我需要通过命令行调用jobs/trans来运行,因此我使用pan.sh和kitchen.sh来触发它们运行。 然而,每当它被触发时,它都会创建一个单独的 JVM。我正在考虑...
无法在 Pentaho Data Integration 9.2 中运行作业(kjb)
我尝试使用pentaho 9.2运行作业,但在按厨房评论运行时没有选择作业 ./kitchen.sh -rep=repo1 -file=/var/lib/jenkins/project/path/etl/Job1.kjb Job1.kjb 包含多个...
我正在使用 Pentaho 数据集成 (PDI)-spoon 来创建 ETL,并且我非常关注性能。 我开发了一个 ETL 来处理 MySQL 8 中的 2,500,000 行副本(每行有 104 列)...
我正在使用Pentaho数据集成,我需要将名为“密度”的变量中的字符串值内容转换为数值。 例如,如果密度=“6.5”,我需要转换...
如何使用 python 脚本更改 Pentaho 中的数据库连接变量?
在将转换从一个环境复制到另一个环境时,我试图尽量减少工作量。目前,从开发环境切换时,我们必须手动更改每个数据库连接变量...
Pentaho CE 6.1 到 CE 8.1 升级 - 项目失败
我正在尝试使用一个父 .ktr 和一些子转换(子 .ktr)运行一个转换。在原始 PDI 6.1 上运行时,所有地图都可以成功运行。在升级版本上运行时...
pentaho spoon/pid:如何每次将文件移动到不同名称的文件夹?
我每个月都有新的文本文件,我从中提取数据并进行一些转换。在每个月底,我需要将这些文件移动到名称为当前日期的文件夹中。这意味着...