提取在两个单独的列中重复的文本

Question

我有一个df：

我想提取 A 列和 B 列中出现的所有重复名称。例如，最终的 df 应如下所示：

我尝试过 .duplicate(subset=["Column A", "Column B"]) 和 .drop_duplicates，但这些仅显示每行的重复项，而不是每列的重复项。

Answer 1

尝试：

mask = df["Column A"] == df["Column B"]
print(df[mask])

打印：

  Column A Column B
1      Tom      Tom
3     Mark     Mark
4     Jack     Jack