查找查找表中存在的列值的组合

Question

假设我有 2 个数据框

d1

和

d2

，可以使用下面的代码生成。

d1 = pd.DataFrame({'c1':['A', 'B', 'C', 'D', 'E', 'F'],
                            'c2': ['G', 'H', 'I', 'J', 'K', 'L'],
                            'val':[10, 20, 30, 40, 50, 60]})

d2 = pd.DataFrame({'c1':['A', 'B', 'C', 'D', 'E', 'F'],
                     'c2': ['H', 'H', 'I', 'J', 'L', 'K'],
                     'c1_found' : [1, 1, 1, 1, 1, 1],
                     'c2_found' : [1, 1, 1, 1, 1, 1]})

我想通过检查表

c1_c2_found

中是否存在

c1

和

c2

组合来创建列

d1

。

我可以使用下面的代码来实现这一点。是否有更优化的方法（向量化方法）可以用来解决这个问题？

# Check if both 'c1' and 'c2' values in d1 exist in d2
merged_data = pd.merge(d2, d1, on=['c1', 'c2'], how='inner')

d2['c1_c2_found'] = d2.apply(lambda row: 1 if (row['c1'], row['c2']) in zip(merged_data['c1'], merged_data['c2']) else 0, axis=1)

Answer 1

IIUC 你可以在 d2 上进行

left

合并：

d2 = d2.merge(d1, on=["c1", "c2"], how="left")
d2["c1_c2_found"] = d2.pop("val").notna().astype(int)
print(d2)

打印：

  c1 c2  c1_found  c2_found  c1_c2_found
0  A  H         1         1            0
1  B  H         1         1            1
2  C  I         1         1            1
3  D  J         1         1            1
4  E  L         1         1            0
5  F  K         1         1            0

查找查找表中存在的列值的组合

问题描述投票：0回答：1

1个回答

最新问题

查找查找表中存在的列值的组合

问题描述 投票：0回答：1

1个回答

最新问题

问题描述投票：0回答：1