我有一个看起来像这样的数据框:
'id': ["1", "2", "1", "3", "3", "4"],
'date': ["2017", "2011", "2019", "2013", "2017", "2018"],
'comments': [None, "bonjour", "bonjour", "hola", "Hello", None]
结果:
id comments
0 1 bonjour
1 2 bonjour
2 3 hola // Hello
3 4 None
我想保留一个ID
如果两个ID相同,我想:
如果注释=无且= str:仅保留不是None的注释(示例:id = 1,保留注释“ hello”)如果两个注释= str:用“ //”连接两个注释(示例id = 3,注释=“ hola // hello”)
目前我尝试使用sort_value和drop_duplicate均未成功
谢谢
我相信您需要在DataFrame.dropna
列之前输入DataFrame.dropna
,然后在comments
之前输入GroupBy.agg
: