pentaho 相关问题

Pentaho BI Suite是一个开源商业智能套件,具有集成的报告,仪表板,数据挖掘,工作流和ETL功能。它主要用Java编写。

Pantaho MySQL 8 连接错误 找不到驱动程序类 'org.gjt.mm.mysql.Driver'

在将 MySQL 5.8 的 ETL 脚本升级到 MySQL8 升级时,一旦我将 data-integration/lib jar 更新为 mysql-connector-java-8.0.xx.jar,它就开始出现以下错误。

回答 8 投票 0

Pentaho 中没有 MongoDB 选项

我最近从 SourceForge 上下载了 Pentaho Data Integration http://sourceforge.net/projects/pentaho/files/Data%20Integration/ 我正在尝试让它连接到 MongoDB。每个教程我...

回答 2 投票 0

Pentaho Kettle 在 JAVA 应用程序中嵌入转换错误处理

我正在使用包含“数据验证器”和“用户定义的Java表达式”步骤的简单转换来测试kettle-sdk-embedding-samples。 其中一项测试包括

回答 1 投票 0

中止pentaho中的作业,日志中没有错误消息

一些背景。我们有一个父作业,它调用一个转换,最终从服务中检索并处理 XML 文件,然后确定...

回答 1 投票 0

如何在pentaho中生成动态年份

我想使用 pentaho 数据集成从 Rest API 访问数据并将结果保存到表中。 我正在使用以下步骤: 生成行步骤 休息客户端 JSON 输入 选择值 表...

回答 1 投票 0

连接到存储库时的 Pentaho 元存储位置

我正在配置存储库以与 Pentaho 一起使用。目前我有一个简单的脚本,它创建一些环境变量(例如 KETTLE_HOME),然后调用/打开提供的 Spoon 客户端。 哈...

回答 1 投票 0

nexus pentaho 不可用?

在我的pom中我有这个依赖 org.pentaho.reporting.engine 经典核心 9.2.0.0-...

回答 1 投票 0

如何获取@odata.nextLink等特殊字符的json路径":"https://graph.microsoft.com/v1.0/users

在 Pentaho Spoon 中,我尝试构建将从 Azure AD 读取数据的转换,然后将此数据推送到另一个应用程序。 现在我面临的问题是分页...

回答 1 投票 0

当您在 Pentaho DI 中使用作业的 START STEP 安排作业时,如何取消作业安排或终止调度程序?

我已安排一项作业每天使用作业的“开始步骤”运行,而不使用“计划预设”,现在我无法在计划作业中找到它,但该作业每天在特定日期运行,我想

回答 1 投票 0


使用 PDI Pentaho 中的表名称获取转换详细信息

我知道我的数据库表名称,它正在作业内的 Pentaho PDI 转换中的一个转换中使用。但我不知道同一张桌子还用在其他地方

回答 1 投票 0

如何在Windows中的Pentaho(PDI)中使用“执行进程”来运行anaconda python?

我将通过在pdi中和特定的anaconda环境中“执行一个进程”来运行一个python程序。 这是我的解决方案,但不起作用: run_on_win = "C:\Users\x\Anaconda3\Scr...

回答 2 投票 0

是否可以使用Pentaho将文件从S3存储桶的一个文件夹移动到S3存储桶的另一个文件夹?

我正在尝试搜索一个组件,它可以帮助我将文件从一个S3存储桶文件夹移动到Pentaho数据集成中的另一个文件夹。

回答 1 投票 0

如何循环遍历 XML 中的元素以分解并加载到数据库

我有一个要求,传入的 XML 必须被分解并加载到数据库中。 所有元素都有各自的表格。 传入的 XML 看起来像这样: 我有一个要求,传入的 XML 必须被分解并加载到数据库中。 所有元素都有各自的表格。 传入的 XML 看起来像这样: <root> <creditreport> <data1> <A>val1</A> <B>val2</B> </data1> <data2> <C>val3</C> <D>val4</D> </data2> <data3> <E>val5</E> <F>val6</F> </data3> <data3> <G>val7</G> <H>val8</H> </data3> </creditreport> </root> 现在在 Kettle 中,我正在设计一个通用框架,它可以获取 XML 并将其分解到数据库中。 我正在使用“获取 XML 数据”组件来读取 XML。 我已将“循环 Xpath”定义为 root/creditreport,然后我将字段一一读取为: name xpath Element ResultType A data1 Node Valueof B data1 Node Valueof ..... ..... ..... E data3 Node Valueof ..... ..... G data3 Node Valueof 但问题是,它只粉碎了第一行并丢失了第二行。我可以理解原因,因为 XPATH 循环仅到 。 如果我将“xpath循环”定义为“root/creditreport/data3”,那么元素“data3”的问题就得到解决,但还有其他元素也可以重复,然后我将再次站在问题的起点。 有什么建议吗!! 如果父节点(dataX)和子节点(A、B、C 等)确实是唯一/连续的,您可以进行一个非常通用的设置: 使用 /root/creditreport/*/* 作为 xpath 循环路径 手动设置这样的字段: 这应该给你一个像这样的输出: 从这里您可以根据需要对数据进行非规范化或其他处理。请注意,我已经为父级别的节点添加了序列号,因此您可以区分第一个 Data3 和第二个,等等。 另一方面,如果您的 dataX 节点都具有相同的子节点(A、B A、B 而不是 A、B C、D 等),您可以使用 /root/creditreport/* 作为 xpath 循环路径并跳过父节点字段,配置通常你的值节点 A 和 B。 以下是定义和输出。所有字段都是相对于当前节点 (.) 定义的。 我也有同样的问题。如何在 Loop xpath 中循环 xml 元素。 可以请指教吗

回答 2 投票 0

通过命令行在Carte服务器上运行Pentaho作业或转换

我需要通过命令行调用jobs/trans来运行,因此我使用pan.sh和kitchen.sh来触发它们运行。 然而,每当它被触发时,它都会创建一个单独的 JVM。我正在考虑...

回答 1 投票 0

通过命令行在 Certe Server 上运行 Pentaho 作业或转换

我需要通过命令行调用jobs/trans来运行,因此我使用pan.sh和kitchen.sh来触发它们运行。 然而,每当它被触发时,它都会创建一个单独的 JVM。我正在考虑...

回答 1 投票 0

如何在Pentaho DI中添加新列到流中,不阻塞流,新列值不是恒定的

我在 sv 节点的主流中有这样的管道结果,如下所示 以及图中顶部的节点辅助节点的结果 结果我应该得到这样的结果 如何获得像

回答 1 投票 0

无法在 Pentaho Data Integration 9.2 中运行作业(kjb)

我尝试使用pentaho 9.2运行作业,但在按厨房评论运行时没有选择作业 ./kitchen.sh -rep=repo1 -file=/var/lib/jenkins/project/path/etl/Job1.kjb Job1.kjb 包含多个...

回答 2 投票 0

使用Pentaho ETL工具读取VarBinary(Max)

尝试从存储在 VarBinary(max) 中的 SQL Server 中提取数据并使用 pentaho ETL 工具将其存储到文本文件中。提取数据时获取无效数据,该数据存储为

回答 1 投票 0

kettle/status 中 xml=n 的 java.lang.NullpointerException

我正在尝试通过水壶/状态页面检查我的作业状态,但是,我收到以下错误。使用xml=y参数,页面显示状态列表。 java.lang.

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.