使用 python 将空列添加到 Spark 中的数据框

问题描述 投票:0回答:3

我有一个数据框,我想用另一个数据框制作

unionAll
。问题是第二个数据框比第一个数据框多了三列。有没有办法让我在第一个数据框中添加只有空单元格的三列?

python pyspark apache-spark-sql rdd
3个回答
3
投票

也许这会有所帮助

添加字符串类型列:

from pyspark.sql.types import StringType

df.withColumn("COL_NAME", lit(None).cast(StringType()))

添加整数类型

from pyspark.sql.types import IntegerType

df.withColumn("COL_NAME", lit(0).cast(IntegerType()))

1
投票

使用spark-dataframe的

withColumn
对象
DF.withColumn("NewCol","Value")


1
投票
df.withColumn('NewColumn', lit(None).cast(StringType()))
© www.soinside.com 2019 - 2024. All rights reserved.