我有 Pandas Series,在其中找到重复值,并且我尝试用 value_integer 替换/重命名这些重复值。例如:
我正在使用自定义函数来查找系列中的重复项
def find_duplicates(self,data,key): 返回结果
返回系列中所有重复项的系列。
现在我将此函数传递给另一个函数,我希望在其中重命名这些值/用 _2,_3,_4 .... 替换重复项。
def rename_duplicates(self,data=None,key=None): 计数 = 1 重复项 = self.find_duplicates(data,key)
return data
苹果 苹果 苹果 香蕉 香蕉 橙子 橙色
我想要得到
重复值
apple_2
apple_3
apple_4
banana_2
banana_3
orange_2
orange_3
cumcount
df['new'] = df['yourcol'] + '_' +df.groupby('yourcol').cumcount().add(1).astype(str)