我想在不指定所有列名称的情况下计算每列的平均值。
例如,而不是:
res = df.select([mean('col1'), mean('col2')])
我想做等同于的事情:
res = df.select([mean('*')])
有可能吗?
您可以通过以下方式完成
res = df.select(*[mean(c).alias(c) for c in df.columns])