我具有如下数据框:
hello=pd.DataFrame(data={'citing':[11,13,11,15,17,18,18,17,20,15],'cited'[13,15,18,20,18,15,15,20,13,11],\
'firm':'A','D','A','C','D','C','C','D','F','C']})
该列引用在同一行中具有其相应的公司价值。列引用中的所有元素都可以列引用中找到,但顺序不同。我正在尝试创建另一列,该列将基于从引用中获得的公司价值列出“被引用”的公司价值。
例如新列的值将为['B','C','E','F','E','C','C','F','B','A']。这是因为“引用”中的13的固定值为“ B”。因此,“引用”中的13在新列中也应带有“ B”。希望我能正确解释这一点。如果您能提供帮助,将不胜感激。谢谢!
您可以使用地图。
hello['firm2'] = hello.cited.map(hello.drop_duplicates('citing').set_index('citing').firm)
citing cited firm firm2
0 11 13 A B
1 13 15 B C
2 11 18 A E
3 15 20 C F
4 17 18 D E
5 18 15 E C
6 18 15 E C
7 17 20 D F
8 20 13 F B
9 15 11 C A