如何在一列上连接pandas数据帧和覆盖?

问题描述 投票:0回答:1

考虑以下数据帧:

import pandas as pd

data1={'column_a' : ['a','a','b','c','d','e'],
      'column_b' : [1,2,3,4,5,6],
      'column_c' : [9,8,6,4,5,4]}

data2={'column_a' : ['f','f','g','a','a','a'],
      'column_b' : [7,8,9,7,5,6],
      'column_c' : [6,8,7,6,5,4]}

df_1 = pd.DataFrame(data1)
df_2 = pd.DataFrame(data2)

你如何连接2个数据帧,以便df_2将附加到df_1,但覆盖df_1上的column_a?我正在寻找以下结果

column_a    column_b    column_c
b   3   6
c   4   4
d   5   5
e   6   4
f   7   6
f   8   8
g   9   7
a   7   6
a   5   5
a   6   4

注意来自df_1的顶部带有'a'的2行不再可用,因为它们被来自df_2的3 a覆盖。

python pandas join override concat
1个回答
3
投票

appendconcat之前做一个过滤器

pd.concat([df_1.loc[~df_1.column_a.isin(df_2.column_a)],df_2])
Out[29]: 
  column_a  column_b  column_c
2        b         3         6
3        c         4         4
4        d         5         5
5        e         6         4
0        f         7         6
1        f         8         8
2        g         9         7
3        a         7         6
4        a         5         5
5        a         6         4
© www.soinside.com 2019 - 2024. All rights reserved.