我有 2 种包含数据的文件,分别是 CSV 和 XML,我想用 Python 编码,可能使用 Pandas 从 2 个文件中读取数据,并进行比较以检查其中一个文件是否更改了数据,而另一个文件没有更改t 因此它会向用户打印消息。总而言之,编写 python 代码来比较不匹配数据并向用户打印消息
我已经尝试过:
def read_csv(file_path):
...
def read_xml(file_path):
...
def compare_files
mismatches = pd.concat([df_csv_subset, df_xml_subset]).drop_duplicates(keep=False)
# Identify missing data
missing_csv = df_xml_subset.merge(df_csv_subset, how='left', indicator=True).query('_merge == "left_only"').drop('_merge', axis=1)
missing_xml = df_csv_subset.merge(df_xml_subset, how='left', indicator=True).query('_merge == "left_only"').drop('_merge', axis=1)
存在比较文件功能且初始化错误
def compare_files(df_csv, df_xml):
mismatches_csv = pd.concat([df_csv, df_xml]).drop_duplicates(keep=False)
mismatches_xml = pd.concat([df_xml, df_csv]).drop_duplicates(keep=False)
return mismatches_csv, mismatches_xml
mismatches_csv, mismatches_xml = compare_files(df_csv, df_xml)
我认为这应该能满足你的需求