将json sturc值拆分为Pyspark中的多个列

Question

我正在将json文件导入pyspark数据框。我已经用以下代码导入了json

df = sqlContext.read.json("json_file.json").select("item", "attributes")

我想将属性从一列拆分为多列。

这里是示例json格式：

{"item":"item-1","attributes":{"att-a":"att-a-15","att-b":"att-b-10","att-c":"att-c-7"}}
{"item":"item-2","attributes":{"att-a":"att-a-15","att-b":"att-b-10","att-c":"att-c-7"}}

Answer 1

如果您希望看到这样的输出

使用from pyspark.sql import functions as f

df.select('item','attributes.*').show()

以便所有属性都可以在多列中看到。

将json sturc值拆分为Pyspark中的多个列

问题描述投票：0回答：1

1个回答

最新问题

将json sturc值拆分为Pyspark中的多个列

问题描述 投票：0回答：1

1个回答

最新问题

问题描述投票：0回答：1