我在 ADLS 中有 json 文件,想要从 json 文件中删除元数据属性,并使用 ADF 管道或使用 pyspark dataframe 将其转换为镶木地板。该数据的示例如下
[
{
"metadata": {
"pageNumber": 1,
"totalPages": 3,
"recordCount": 1000,
"totalRecords": 2097
},
"records": [
{
"doctor_id": "3678356",
"doctor_name": "AAasIasM asdas",
"center_id": "2",
"speciality": "Homeopathy",
"degree": null,
"is_active": "Yes",
"license_no": "DH1A-P-0asda17",
"usertype": "EXTERNAL USER",
"total_count": "2097"
}
]
}
]
为了使用 ADF 从 JSON 文件中删除元数据,您可以使用 ADF 中的数据流活动。以下是执行此操作的步骤:
Array of documents
作为文档形式。+ Add Mapping
添加基于规则的映射,并提供如下图所示的映射。展平变换的输出将类似于下图。
set single partition
将数据输出到单个文件。