如何在Azure数据工厂的数据流中动态拆分扁平化的xml?

问题描述 投票:0回答:1

我正在导入具有以下结构的 xml 文件。

xml

然后我用数据流来转换它。我要做的第一步是按标签展开并展平。我知道需要根据发票编号拆分为两个不同的分支,因为我需要为每个发票编号输出单独的 JSON。

dataflow

我以为我可以使用条件拆分,但我不知道如何动态进行拆分,因为我事先不知道发票编号,所以我无法对它们进行硬编码,此外,我导入的每个 xml 文件可以有一个唯一的发票编号或更多比一个,它会有所不同。

知道如何解决这个问题吗?

azure azure-data-factory data-engineering
1个回答
0
投票

由于您想使用发票编号来划分文件,因此您可以使用接收器转换本身提供的分区选项。下面是方法。

  • 使用派生列转换添加一个名为

    filename
    的新列,并分配
    Invoice_number
    列的值。

  • 然后进行接收器转换并在接收器设置中,将

    Name file as column data
    作为文件名选项。将
    filename
    作为列数据。

这将根据 invoice_number 列本身划分文件,每个文件名将具有发票编号本身的值。

© www.soinside.com 2019 - 2024. All rights reserved.