将printSchema（）函数的结果保存到Pyspark中的变量中？

问题描述投票：0回答：1

我正在使用printSchema函数来推断Json文件的架构。我想将此函数调用的结果保存在变量中，以逐行解析它，以便提取架构的结构并将其转换为DDL架构，以在Hive中创建表。

如何完成？

apache-spark pyspark ddl

1个回答

0
投票

如果检查source code for printSchema()，您将看到此功能仅执行以下操作：

printSchema()

因此，您可以将输出保存如下：

print(self._jdf.schema().treeString())

[其他参考：

printSchemaString = df._jdf.schema().treeString()
Saving result of DataFrame show() to string in pyspark

最新问题

© www.soinside.com 2019 - 2024. All rights reserved.