我必须从一个数据帧从另一个数据框中的值替换值。
例如波纹管的作品,但我为了与“新”的列值,以取代“第一”列中的值比下降的“新”列额外的步骤。
In [1]: import pandas as pd
In [2]: df = pd.DataFrame([['A', 'X'],
...: ['B', 'X'],
...: ['C', 'X'],
...: ['A', 'Y'],
...: ['B', 'Y'],
...: ['C', 'Y'],
...: ], columns=['first', 'second'])
In [3]: df
Out[3]:
first second
0 A X
1 B X
2 C X
3 A Y
4 B Y
5 C Y
In [4]: df_tt = pd.DataFrame([['A', 'E'],
...: ['B', 'F'],
...: ], columns=['orig', 'new'])
In [5]: df_tt
Out[5]:
orig new
0 A E
1 B F
In [6]: df = df.merge(df_tt, left_on='first', right_on='orig')
In [7]: df
Out[7]:
first second orig new
0 A X A E
1 A Y A E
2 B X B F
3 B Y B F
In [8]: df['first'] = df['new']
In [9]: df
Out[9]:
first second orig new
0 E X A E
1 E Y A E
2 F X B F
3 F Y B F
In [10]: df.drop(columns=['orig', 'new'])
Out[10]:
first second
0 E X
1 E Y
2 F X
3 F Y
我想,没有额外的步骤来替换值。
使用isin
与boolean indexing
过滤,然后map
:
df = (df[df['first'].isin(df_tt['orig'])]
.assign(first=lambda x: x['first'].map(df_tt.set_index('orig')['new'])))
print (df)
first second
0 E X
1 F X
3 E Y
4 F Y
替代方案:
df = df[df['first'].isin(df_tt['orig'])]
df['first'] = df['first'].map(df_tt.set_index('orig')['new'])
另一种解决方案是使用replace:
# Restrict to common entries
df = df[df['first'].isin(df_tt['orig'])]
# Use df_tt as a mapping to replace values in df
df['first'] = df['first'].replace(df_tt.set_index('orig').to_dict()['new'])
解决方案非常相似,@jezrael,但我喜欢明确使用replace
的想法,因为这是你在做什么实际:基于另一个数据框在一个数据帧替换值。