上图是我目前正在处理的部分数据,其中fips列的一些数据缺失。我试图使用其他列的信息来替换丢失的值。我想写一个代码,如果fips值丢失,那么它将尝试匹配县和州的详细信息与其他行,如果有一个匹配,然后使用该行的fips代码来填补丢失的值。可以做到吗?
你可以试试这个吗?df.groupby(['state', 'county'])['fips'].apply(lambda x : x.bfill().ffill()))
df.groupby(['state', 'county'])['fips'].apply(lambda x : x.bfill().ffill()))
我假设每个州+县的fips值是唯一的。