我正在使用printSchema
函数来推断Json文件的架构。我想将此函数调用的结果保存在变量中,以逐行解析它,以便提取架构的结构并将其转换为DDL架构,以在Hive中创建表。
如何完成?
如果检查source code for printSchema()
,您将看到此功能仅执行以下操作:
printSchema()
因此,您可以将输出保存如下:
print(self._jdf.schema().treeString())
[其他参考:
printSchemaString = df._jdf.schema().treeString()