我是python数据分析的新手,如果问题简单化了,我很抱歉lol 我正在使用groupby方法总结我的数据,以获得每年的零件总数,我已经得到了答案,但当我打印出表格时,我不想把所有其他列也包括在内。
图片显示了我的输出(在右边)与我想达到的目标在左边。
试试这个。
themes_by_year = sets.groupby('year')['theme_id'].size().reset_index()
希望能帮到你...
如果你想显示一个列,你只需要添加它像:df['列名']。 在你的例子中: theme_by_year['theme_id'].head()
所以,你不求和,只求数?
theme_by_year = sets.groupby('year')['theme_id'].count().reset_index()
theme_by_year.head()