成对读取两个CSV文件,每两对进行比较

问题描述 投票:0回答:1

我有一个包含多个CSV文件的文件夹,其名称如下CINinfo_2019-08-08_rev1,CINinfo_2019-08-08_rev2,CINinfo_2019-08-08_rev3,CINinfo_2019-08-08_rev4,我在一个文件夹中有大约70个文件,我的意图是使此过程自动化,以便可以自动读取它们分成两对,然后比较每对的差异,并将结果作为一个组合表。目前,我正在手动阅读它们并比较差异,这是代码:

import pandas as pd
df1 = pd.read_csv("CINinfo_2019-08-08_rev1.csv")
df2 = pd.read_csv("CINinfo_2019-08-08_rev2.csv")

import numpy as np
rows,cols=np.where(comparison_values==False)

for item in zip(rows,cols):
    df1.iloc[item[0], item[1]] = '{} --> {}'.format(df1.iloc[item[0], item[1]],df2.iloc[item[0], item[1]])

此过程非常繁琐,我还有其他需要读取CSV文件的文件夹。 Note CSV文件的命名方式,所有CSV文件都具有相同的前缀(CINinfo_2019-08-08 _),但是在这种情况下的后缀名称(rev)具有从1到1的递增数字。 70.我成对读取文件的方式是1和22和3, 3和4。在这种情况下,我将像这样的对进行比较:CINinfo_2019-08-08_rev1和CINinfo_2019-08-08_rev2然后是CINinfo_2019-08-08_rev2 nd CINinfo_2019-08-08_rev3那样,如何使读数自动化成对的文件,然后比较每对文件中的差异,并有一个联接表?

python python-3.x pandas csv dataframe
1个回答
0
投票

您可以尝试这样的事情:

© www.soinside.com 2019 - 2024. All rights reserved.