如何重命名 Pandas Series 中的重复值?

问题描述 投票:0回答:1

我有 Pandas Series,在其中找到重复值,并且我尝试用 value_integer 替换/重命名这些重复值。例如:

  1. 我正在使用自定义函数来查找系列中的重复项

    def find_duplicates(self,data,key): 返回结果

返回系列中所有重复项的系列。

  1. 现在我将此函数传递给另一个函数,我希望在其中重命名这些值/用 _2,_3,_4 .... 替换重复项。

    def rename_duplicates(self,data=None,key=None): 计数 = 1 重复项 = self.find_duplicates(data,key)

    return data
    
    
重复值

苹果 苹果 苹果 香蕉 香蕉 橙子 橙色

我想要得到

重复值

apple_2 apple_3 apple_4 banana_2 banana_3 orange_2 orange_3

    然后放回原来的数据框
python pandas dataframe
1个回答
1
投票
尝试使用

cumcount


df['new'] = df['yourcol'] + '_' +df.groupby('yourcol').cumcount().add(1).astype(str)
    
© www.soinside.com 2019 - 2024. All rights reserved.