这个问题在这里已有答案:
我有以下数据集:
Year Company Product Sales
2017 X A 10
2017 Y A 20
2017 Z B 20
2017 X B 10
2018 X B 20
2018 Y B 30
2018 X A 10
2018 Z A 10
我想获得以下摘要:
Year Product Sales
2017 A 30
B 30
2018 A 50
B 20
以及以下摘要:
Year Company Sales
2017 X 20
Y 20
Z 20
2018 X 50
Y 10
Z 10
有没有办法不使用循环?
我知道我可以用函数聚合做一些事情,但我不知道如何在不混合公司,产品和年份数据的情况下继续进行。例如,我获得了产品A和B的总销售额,但它混合了两年的销售额而不是2017年的A和B,并在2018年分开。
你有什么建议吗?
假设您的数据框名为df:
df1 = df.groupby('Year', 'Product')['Sales'].sum()
df2 = df.groupby('Year', 'Company')['Sales'].sum()
我相信这可以帮助您创建两个摘要数据帧而不会混合任何东西:)!