背景
我有两个 Dataframe,我想验证每个 DataFrame 的每个 ID 具有相同的值。我想创建一个包含所有不匹配的行/异常值的数据框。
样本数据
DF1
ID State Occupation
111 AZ Doctor
222 NY Teacher
333 MO Analyst
444 NC Nurse
DF2
ID State Occupation
111 AZ Doctor
222 NY Teacher
333 MO Analyst
444 NC Student <---- **It should flag this
实际数据集大约有 30,000 多行。是否可以根据 ID 并分配特定列(例如“州”和“职业”)来检查两个数据帧?
假设它们具有相同的列和行,并且根据 ID 列以相同的方式排序:
df_error = df_1[(df_1 !=df_2).any(1)]