如何动态加载包含不同sheet名称的不同Excel文件到SQL

问题描述 投票:0回答:1

*这是一般上下文:尝试将数据从 Azure Data Lake 中托管的 Excel 文件复制到 Azure SQL 数据库 * 这是我目前的情况:我正在使用 Microsoft Azure 云,实际上我在 Azure datalake 中有一个容器,其中包含多个 Excel 文件,每个文件都有不同数量、不同名称的工作表,我想使用 Azure 数据工厂管道能够在 Azure SQL 数据库中为这些文件的每张表创建一个表,所有这些都是动态的。

注意:记住不是单个excel文件,我有几个文件需要从路径中读取。

我发现您可以使用 获取元数据活动 获取特定路径中每个文件的名称,并使用 查找活动 指定包含 csv 或 txt 文件的路径,该文件包含带有工作表名称的列表但我不太清楚如何将两者与 for every 循环 集成,如果有人知道如何做到这一点并且可以提供帮助或有另一个解决方案,我将不胜感激。

如果您需要我扩展我的情况信息来帮助我,请告诉我,我会立即做。

谢谢你。

sql azure azure-data-factory azure-data-lake
1个回答
0
投票

您可以通过执行以下几个方面来实现这一目标:

  1. 使用获取元数据活动获取您需要处理的所有 Excel 文件的列表
  2. 对于每个迭代每个 Excel 文件,并使用我的博客中所述的以下逻辑迭代 Excel 中的所有工作表: https://datasharkx.wordpress.com/2022/08/31/iteating-across-all-excel-sheets-dynamically-and-converting-into-csv-files-via-azure-data-factory-synapse-pipeline / https://datasharkx.wordpress.com/2022/09/04/iteating-across-all-excel-sheets-dynamically-and-converting-into-csv-files-via-azure-data-factory-synapse-pipeline -并行/

基本上,您将使用 Excel 数据集的索引属性并执行它直到失败。

然后移至下一个 Excel 文件及其工作表

© www.soinside.com 2019 - 2024. All rights reserved.