pyspark计算一行中所有列的均值

问题描述 投票:1回答:1

我想在不指定所有列名称的情况下计算每列的平均值。

例如,而不是:

res = df.select([mean('col1'), mean('col2')])

我想做等同于的事情:

res = df.select([mean('*')])

有可能吗?

python-3.x pyspark mean
1个回答
0
投票

您可以通过以下方式完成

res  = df.select(*[mean(c).alias(c) for c in df.columns])
© www.soinside.com 2019 - 2024. All rights reserved.