Python:在2个数据帧中查找唯一值,避免重复

问题描述 投票:-1回答:3

我有两个数据帧

df1 = [1, 2, 3, 4, 5]
df2 = [1, 2, 3, 7, 9]

我想得到一个只有[4,5]的新Df(我写的号码,但真正的列表是两个电子邮件列表)然后我将保存DataFrame转换为CSV文件

我该怎么做?

python pandas
3个回答
2
投票
df1 = [1, 2, 3, 4, 5]
df2 = [1, 2, 3, 7, 9]
[x for x in df1 if x not in df2]

2
投票

好像他们是list,然后我们使用set

set(df1)-set(df2)
Out[398]: {4, 5}

0
投票

Diff pandas数据帧:

import pandas as pd
df1 = pd.DataFrame([1, 2, 3, 4, 5])
df2 = pd.DataFrame([1, 2, 3, 7, 9])
df3 = df1.merge(df2, indicator=True, how='outer')
df3[merged['_merge'] == 'left_only']

合并pandas数据帧:

df4 = pd.concat([df1, df2]).drop_duplicates(keep=False)

© www.soinside.com 2019 - 2024. All rights reserved.