基于dat和第二列删除重复值，并保持最小值

Question

我正在尝试根据初始日期和保单号删除重复的值，将第一个条目保留在某个日期。例如，如果我有两条记录，例如：

 policy_number        initial_date
    123456                  01/02/97
    123456                  01/02/99

和我想要的输出应该看起来像这样。

 policy_number        initial_date
    123456                  01/02/97

直到'我现在已经尝试过：

df.drop_duplicates(['POLICY_NUMBER','initial_date'], keep="first", inplace=True)

 df.sort_values('initial_date').drop_duplicates('initial_date',keep='first')

但仍然不值得，输出看起来与原始的相同或仅基于忽略策略编号的日期丢弃

两个变量都是对象dtype

Answer 1

用途：

df.sort_values('initial_date').drop_duplicates('policy_number',keep='first')

或

df.sort_values('initial_date').groupby('policy_number',as_index=False).first()

输出

   policy_number initial_date
0         123456     01/02/97

基于dat和第二列删除重复值，并保持最小值

问题描述投票：0回答：1

1个回答

最新问题

基于dat和第二列删除重复值，并保持最小值

问题描述 投票：0回答：1

1个回答

最新问题

问题描述投票：0回答：1