PySpark-基于条件的过滤选择。groupby

问题描述 投票:0回答:1

我正在尝试使用.groupBy函数根据国家/地区(美国=美国)的排名来查找AVG分数>

这是我当前的代码:该代码仅用于显示来自美国的玩家的排名,我只希望它显示基于平均排名的平均国籍。任何帮助将不胜感激。

 df.groupby(['Nationality', 'Position])\
.agg({"Score": "AVG"})\
.orderBy("Nationality", ascending=True)\
.show()

我正在尝试使用.groupBy函数根据国家/地区(美国=美国)的位置来查找AVG分数。这是我当前的代码:该代码仅适用于我显示的每个国籍...]]

python pyspark pyspark-sql
1个回答
0
投票

只需在您的分组依据之前插入df.filter(df.Nationality == "USA)

df.filter(df.Nationality == "USA")\
.groupby(['Nationality', 'Position'])\
.agg({"Score": "AVG"})\
.orderBy("Nationality", ascending=True)\
.show()
© www.soinside.com 2019 - 2024. All rights reserved.