我需要基于两个文件的交集合并两个csv文件，我想删除未重复的列

Question

例如，如果文件1看起来像这样：

 id  col1  col2  col3
 --------------------
  1  aa    bb     cc
  2  dd    ff     gg

和文件2看起来像

 id  col1  col2  col3  col4
 ---------------------------
  3   qq    ww    ee    tt

我希望输出文件看起来像

 id   col1   col2   col3
 -----------------------
  1   aa     bb     cc
  2   dd     ff     gg
  3   qq     ww     ee

意思是我只希望基于交集合并文件，并且我想丢弃两个文件中未重复的列

我尝试了以下尝试

df1= pd.read_csv("lastOne.csv")
df2=pd.read_csv("Normal.csv")
dfAll=pd.concat([df1, df2], axis=1, join='inner')

我也尝试了df1.combine_first（df2），但都无法满足我的需要

Answer 1

您已经接近，但是您选择了错误的轴。

axis = 0用于当您想要添加更多行，且具有相似的列时]

axis = 1当您要添加更多列且行相似时

正确的答案是：

pd.concat([df1, df2], join='inner', axis=0)