我有一个关于group by和sum的困惑(和一个有趣的观察)。
我有一个NBA数据集,在这个数据集中,我执行了以下两个独立的操作。
A:df.groupby('Team')['Salary'].sum()
B :
gb1 = df.groupby(['团队','职位','学院'])['薪资'].sum()
gb2 = gb1.groupby('Team')['Salary'].sum()
B部分中gb2的输出与A部分的输出不同,我想知道,为什么会这样?我想应该是一样的,因为在这两种方法(A和B)中,我实际上是按团队分组,并取工资总和。那为什么它们不一样呢?