我有一个DataFrame,其中包含作业编号和与该作业相关联的客户名称。在某些情况下,职位编号没有客户名称,因此为空。我有一个单独的系列,其中将这些工作编号作为索引,并根据工作编号将缺少的客户名称替换为空值。我不完全确定如何将其映射到原始DataFrame列。
这是原始的DataFrame(df):
Job Number Customer
0 02123 Paul F
1 46456 nan
2 56823 Kevin T
3 62948 nan
替换nan值的序列:
Job Number
46456 Kara L
62948 Sabrina M
Name: Customers, dtype: object
我需要的最终输出是:
Job Number Customer
0 02123 Paul F
1 46456 Kara L
2 56823 Kevin T
3 62948 Sabrina M
我希望这是有道理的。我看过其他答案,例如使用:df['Customer'] = df['Job Number'].map(customers)
,但还是不行或test['Customer'] = df['Customer'].combine_first(df['Customer'].map(customers))
。
我不确定如何将代码粘贴到此处,所以我已经手工写出了df和series。
任何帮助将不胜感激。
您可以将reset_index
与combine_first
一起使用:
(df.set_index('JobNumber').squeeze()
.combine_first(customers.set_index('Job').squeeze())
.reset_index())
index Customer
0 2123 Paul F
1 46456 Kara L
2 56823 Kevin T
3 62948 Sabrina M
这里需要在map
列旁使用Job Number
,而不是Customer
:
df['Customer'] = df['Customer'].combine_first(df['Job Number'].map(customers))
print (df)
Job Number Customer
0 2123 Paul F
1 46456 Kara L
2 56823 Kevin T
3 62948 Sabrina M
详细:
print (df['Job Number'].map(customers))
0 NaN
1 Kara L
2 NaN
3 Sabrina M
Name: Job Number, dtype: object