PySpark-基于条件的过滤选择。groupby

问题描述投票：0回答：1

我正在尝试使用.groupBy函数根据国家/地区（美国=美国）的排名来查找AVG分数>

这是我当前的代码：该代码仅用于显示来自美国的玩家的排名，我只希望它显示基于平均排名的平均国籍。任何帮助将不胜感激。

 df.groupby(['Nationality', 'Position])\
.agg({"Score": "AVG"})\
.orderBy("Nationality", ascending=True)\
.show()

我正在尝试使用.groupBy函数根据国家/地区（美国=美国）的位置来查找AVG分数。这是我当前的代码：该代码仅适用于我显示的每个国籍...]]

python pyspark pyspark-sql

1个回答

0
投票

只需在您的分组依据之前插入df.filter(df.Nationality == "USA)。

df.filter(df.Nationality == "USA")\
.groupby(['Nationality', 'Position'])\
.agg({"Score": "AVG"})\
.orderBy("Nationality", ascending=True)\
.show()

最新问题

© www.soinside.com 2019 - 2024. All rights reserved.