我有两只熊猫DF。大小不等。例如:
Df1
id value
a 2
b 3
c 22
d 5
Df2
id value
c 22
a 2
否,我想从DF1中提取与
x=[]
for i in range(len(DF2)):
for j in range(len(DF1)):
if DF2['id'][i] == DF1['id'][j]:
x.append(DF1.iloc[j])
现在可以,但是对于2个文件,一个文件包含40万行,另一个文件包含5,000,我需要一种高效的Pythonic + Pnadas方式
您可以尝试以下方法:
m = pd.concat((df1,df2))
m[m.duplicated('id',keep=False)].drop_duplicates()