考虑以下数据帧:
import pandas as pd
data1={'column_a' : ['a','a','b','c','d','e'],
'column_b' : [1,2,3,4,5,6],
'column_c' : [9,8,6,4,5,4]}
data2={'column_a' : ['f','f','g','a','a','a'],
'column_b' : [7,8,9,7,5,6],
'column_c' : [6,8,7,6,5,4]}
df_1 = pd.DataFrame(data1)
df_2 = pd.DataFrame(data2)
你如何连接2个数据帧,以便df_2
将附加到df_1
,但覆盖df_1
上的column_a
?我正在寻找以下结果
column_a column_b column_c
b 3 6
c 4 4
d 5 5
e 6 4
f 7 6
f 8 8
g 9 7
a 7 6
a 5 5
a 6 4
注意来自df_1
的顶部带有'a'的2行不再可用,因为它们被来自df_2
的3 a覆盖。
在append
或concat
之前做一个过滤器
pd.concat([df_1.loc[~df_1.column_a.isin(df_2.column_a)],df_2])
Out[29]:
column_a column_b column_c
2 b 3 6
3 c 4 4
4 d 5 5
5 e 6 4
0 f 7 6
1 f 8 8
2 g 9 7
3 a 7 6
4 a 5 5
5 a 6 4