Spoon是与Pentaho数据集成套件相关的图形转换和作业设计器 - 也称为Kettle项目。
如何在Windows中的Pentaho(PDI)中使用“执行进程”来运行anaconda python?
我将通过在pdi中和特定的anaconda环境中“执行一个进程”来运行一个python程序。 这是我的解决方案,但不起作用: run_on_win = "C:\Users\x\Anaconda3\Scr...
如何使用 Pentaho Spoon 6 JSON 输入读取多层嵌套 JSON 文件
我有一个包含多个子级别的 JSON 文件,需要使用 PDI 进行解析。让我陷入困境的棘手之处是嵌套数组中的一对多关系。 这是我的 J...
无法在 Pentaho Data Integration 9.2 中运行作业(kjb)
我尝试使用pentaho 9.2运行作业,但在按厨房评论运行时没有选择作业 ./kitchen.sh -rep=repo1 -file=/var/lib/jenkins/project/path/etl/Job1.kjb Job1.kjb 包含多个...
使用Pentaho ETL工具读取VarBinary(Max)
尝试从存储在 VarBinary(max) 中的 SQL Server 中提取数据并使用 pentaho ETL 工具将其存储到文本文件中。提取数据时获取无效数据,该数据存储为
我们正在进行一个数据迁移项目,源数据库和目标数据库都是MySql(版本:5.0.45-community-nt)。 目前源数据库和目标数据库都托管在我的本地
我在Pentaho中为DW构建了一个ETL结构,但是,我们使用不稳定的OLTP数据库作为源,所以有时作业中可能会发生错误(因为数据库关闭)。 我需要创造一份工作...
Pentaho 数据集成:“group by”与用“;”分隔的连接字符串而不是“,”
我必须连接来自不同字段的字符串。输出应该是字段中用分号分隔的所有字符串。 “分组依据”转换步骤完成了我需要做的一切,但我可以
我想用以前的 StoreName 值填充 StoreName 中的空值。例如,前 7 个产品位于“AKHISAR”商店,但商店名称仅对...
我想使用元数据注入来传递数据。目标步骤有 2 个表输入步骤和一个维度查找更新步骤。 这需要以循环超过 100 个表的方式进行。 目前,我是
我正在使用 Pentaho 数据集成 (PDI)-spoon 来创建 ETL,并且我非常关注性能。 我开发了一个 ETL 来处理 MySQL 8 中的 2,500,000 行副本(每行有 104 列)...
我想在pentaho创建一个工作,可以自动发送带有excel附件的电子邮件,但excel数据取决于接收者的电子邮件 源数据来自名为“Report”的表,它...
我将上一步中选择的信息传递到维度查找/更新步骤。我遇到的问题如下:我将表名和字段作为循环动态传递。所以...
如何从数据库表中获取值并使用该值替换 Pentaho 中的另一个字段
我目前正在使用表输入步骤运行sql来提取数据。我有另一个文本文件输入流,我需要表输入步骤中的数据来替换...
从数据库获取数据并使用 Pentaho 动态地将其输出到另一个数据库
我已经尝试解决以下问题有一段时间了。我希望你能帮忙。 我正在使用 pentaho 将表从一个数据库传递到另一个数据库。我正在使用数据输入步骤,其中我是
我有一个通过 FTP 收到的文件。该文件需要放置在 PostgreSQL 中。怎么做?我尝试使用“批量加载到 MySQL”来完成此操作,我选择了所需的数据库,但是文件
从 Pentaho-Spoon 运行“文本文件输出”时,但某些值未输出
我想创建一个执行SQL结果的文件。 因此,我创建了一个由“表输入 - 文本文件输出”组成的转换。但它不起作用。 如果我看到“表格输入 - 预览行&
无法从存储库打开 Pentaho Community Edition 9.3 中的 KTR
我已经从 sourceforge 下载了 Pentaho Community Edition 9.3。我已经创建了基于文件的存储库,我的存储库中几乎没有 KTR 和 KJB。问题是当我尝试从存储库打开 KTR 时...
将 tsv 从 Spoon 导入 SQL Server 时出错
在 Microsoft SQL Server 中,我用这句话创建了下表: IF OBJECT_ID(N'dbo.STG_HICP', N'U') 不为空 DROP TABLE dbo.STG_HICP; 创建表 dbo.STG_HICP( 频率 nvarchar(50...
如何使用 python 脚本更改 Pentaho 中的数据库连接变量?
在将转换从一个环境复制到另一个环境时,我试图尽量减少工作量。目前,从开发环境切换时,我们必须手动更改每个数据库连接变量...