我有一个df:
A 栏 | B 栏 |
---|---|
约翰 | 美国能源部 |
汤姆 | 汤姆 |
莎莉 | 梅 |
马克 | 马克 |
杰克 | 杰克 |
我想提取 A 列和 B 列中出现的所有重复名称。例如,最终的 df 应如下所示:
A 栏 | B 栏 |
---|---|
汤姆 | 汤姆 |
马克 | 马克 |
杰克 | 杰克 |
我尝试过 .duplicate(subset=["Column A", "Column B"]) 和 .drop_duplicates,但这些仅显示每行的重复项,而不是每列的重复项。
尝试:
mask = df["Column A"] == df["Column B"]
print(df[mask])
打印:
Column A Column B
1 Tom Tom
3 Mark Mark
4 Jack Jack