提取在两个单独的列中重复的文本

问题描述 投票:0回答:1

我有一个df:

A 栏 B 栏
约翰 美国能源部
汤姆 汤姆
莎莉
马克 马克
杰克 杰克

我想提取 A 列和 B 列中出现的所有重复名称。例如,最终的 df 应如下所示:

A 栏 B 栏
汤姆 汤姆
马克 马克
杰克 杰克

我尝试过 .duplicate(subset=["Column A", "Column B"]) 和 .drop_duplicates,但这些仅显示每行的重复项,而不是每列的重复项。

python dataframe csv duplicates
1个回答
0
投票

尝试:

mask = df["Column A"] == df["Column B"]
print(df[mask])

打印:

  Column A Column B
1      Tom      Tom
3     Mark     Mark
4     Jack     Jack
© www.soinside.com 2019 - 2024. All rights reserved.