我需要基于两个文件的交集合并两个csv文件,我想删除未重复的列

问题描述 投票:0回答:1

例如,如果文件1看起来像这样:

 id  col1  col2  col3
 --------------------
  1  aa    bb     cc
  2  dd    ff     gg

和文件2看起来像

 id  col1  col2  col3  col4
 ---------------------------
  3   qq    ww    ee    tt

我希望输出文件看起来像

 id   col1   col2   col3
 -----------------------
  1   aa     bb     cc
  2   dd     ff     gg
  3   qq     ww     ee 

意思是我只希望基于交集合并文件,并且我想丢弃两个文件中未重复的列

我尝试了以下尝试

df1= pd.read_csv("lastOne.csv")
df2=pd.read_csv("Normal.csv")
dfAll=pd.concat([df1, df2], axis=1, join='inner')

我也尝试了df1.combine_first(df2),但都无法满足我的需要

python pandas csv dataframe merge
1个回答
0
投票

您已经接近,但是您选择了错误的轴。

axis = 0用于当您想要添加更多行,且具有相似的列时]

axis = 1当您要添加更多列且行相似时

正确的答案是:

pd.concat([df1, df2], join='inner', axis=0)
© www.soinside.com 2019 - 2024. All rights reserved.