我有两个 CSV 文件:
index,X,Y
1,1.0,2.0
3,1.3,2.3
和
index,Z
1,3.0
我想在 Python 中读取并连接成 m x 4 numpy 数组 规则是仅应使用两个文件中都存在索引的行。
上面两个文件的结果应该是 1 x 4 数据框或数组:
index,X,Y,Z
1,1.0,2.0,3.0
我自己编写了 50 行(恐怕不是很 Pythonic)代码来执行此操作,但我更喜欢使用更紧凑且经过更好测试的外部代码。我希望解决方案使用 numpy 和 pandas 之一/两者。
用途:
df1 = pd.read_csv('file1.csv')
df2 = pd.read_csv('file2.csv')
out = df1.merge(df2, on='index')