我试图在我的数据框架中添加一个新的列,其中包含组内某行的 "索引 "或 "出现顺序"。
例如,我的数据框架是这样的
col1
0 John
1 Lucy
2 Jane
3 Jane
4 Jane
5 Lucy
我想... groupby('col1')
并得到每个组的出现顺序。
我试图得到这样的东西
col1 col2
0 John 1
1 Lucy 1
2 Jane 1
3 Jane 2
4 Jane 3
5 Lucy 2
我希望我说的很清楚。在我看来,先验并不难,但我就是做不到!
谢谢!我正试图用 "索引 "或 "命令 "在我的数据框架中添加一个新的列。
df['count'] = df.groupby(by=['col1']).cumcount()+1
print(df)
col1 count
0 John 1
1 Lucy 1
2 Jane 1
3 Jane 2
4 Jane 3
5 Lucy 2