了解ADF数据集

问题描述 投票:0回答:1

我了解,在Azure数据工厂中,数据集是某些源数据的视图。您能否通过将两个源表连接在一起的查询来创建单个数据集?还是您必须创建两个数据集,即使用联接转换的数据流,以创建第三个数据集,作为该转换的对象,这是期望的结果?

似乎源表不是ADF中的东西,仅仅是数据集(仅是表)?我觉得这很令人困惑,也许我不理解更高的背景。

azure-data-factory-2
1个回答
1
投票

DataSet不是数据视图,它是指向某个位置的指针,并且可以选择是对该位置处找到的模式的描述。在您的情况下,它是一个指向表的指针,因此,您需要为每个SOURCE表提供一个带有Schema的DataSet。您可以将它们加入数据流中,然后需要另一个用于SINK的数据集。根据接收器类型,您可能需要创建架构,也可能不需要。

我为表假设一些SQL变体-如果是这样,并且如果两个表都在同一个数据库中,那么我建议在SQL中进行JOIN,因为这样做会更快,更有效。如果接收器也位于同一数据库中,那么您将从存储过程而不是数据流中获得最大收益。

© www.soinside.com 2019 - 2024. All rights reserved.