检查特定列中的数据框值是否相等

问题描述 投票:0回答:1

背景

我有两个 Dataframe,我想验证每个 DataFrame 的每个 ID 具有相同的值。我想创建一个包含所有不匹配的行/异常值的数据框。

样本数据

DF1
ID    State    Occupation
111   AZ       Doctor
222   NY       Teacher
333   MO       Analyst
444   NC       Nurse

DF2
ID    State    Occupation
111   AZ       Doctor
222   NY       Teacher
333   MO       Analyst
444   NC       Student   <---- **It should flag this

实际数据集大约有 30,000 多行。是否可以根据 ID 并分配特定列(例如“州”和“职业”)来检查两个数据帧?

python pandas dataframe compare
1个回答
0
投票

假设它们具有相同的列和行,并且根据 ID 列以相同的方式排序:

df_error = df_1[(df_1 !=df_2).any(1)]
© www.soinside.com 2019 - 2024. All rights reserved.