将printSchema()函数的结果保存到Pyspark中的变量中?

问题描述 投票:0回答:1

我正在使用printSchema函数来推断Json文件的架构。我想将此函数调用的结果保存在变量中,以逐行解析它,以便提取架构的结构并将其转换为DDL架构,以在Hive中创建表。

如何完成?

apache-spark pyspark ddl
1个回答
0
投票

如果检查source code for printSchema(),您将看到此功能仅执行以下操作:

printSchema()

因此,您可以将输出保存如下:

print(self._jdf.schema().treeString())

[其他参考:

© www.soinside.com 2019 - 2024. All rights reserved.