读取Pentaho Spoon中的平面文件,然后将其元数据导出到CSV

问题描述 投票:1回答:1

我想知道是否可以使用Pentaho Spoon以CSV格式提取平面文件的元数据。我的意思是,例如,获取CSV文件输入步骤,选择要读取的文件,然后以某种方式访问​​该文件的元数据并将其导出为CSV。

我在文档中发现了3.1.0中引入的名为元数据结构化的步骤,但在最新版本的Spoon中找不到它,也许现在已经将其删除了。

更新:我发现“流的元数据结构”几乎可以完成我需要做的事情。现在,我的转换如下所示:csv文件输入->流的元数据结构->文本文件输出。问题在于它不会提取所有元数据。它不提取格式,十进制和组。它也为我提供了我实际上不需要的Origin列,因此我必须摆脱它。

Update2:我一直试图到达那些缺少的列,但问题是流步骤的元数据结构仅输出这些列“ Position,Fieldname,Comments,Type,Length,Precision,Origin”,因此我无法真正访问例如,格式列是该步骤的输入:(我真的找不到解决方法

csv metadata pentaho flat-file pentaho-spoon
1个回答
0
投票

我不确定这是什么业务场景,那就是动态获取输入文件的元数据,然后将其用于多个文件。我用元数据注入测试了一些东西,它解决了我使用多个文件的目的

这可能会帮助https://help.pentaho.com/Documentation/7.1/0L0/0Y0/0K0/ETL_Metadata_Injection

© www.soinside.com 2019 - 2024. All rights reserved.