列之间的列表关系

Question

我在下面有这个数据框：

df=pd.DataFrame({'cnpj':[410000132,410000132,4830624000197,4830624000197,4830624000197],'Nome Pessoa':['EUGENIO LUPORINI NETO','JUAN MATIAS SERAGOPIAN','EUGENIO LUPORINI NETO','SIMONE FANKHAUSER','ALEX SOUZA']})
print(df)

            cnpj             Nome Pessoa
0      410000132   EUGENIO LUPORINI NETO
1      410000132  JUAN MATIAS SERAGOPIAN
2  4830624000197   EUGENIO LUPORINI NETO
3  4830624000197       SIMONE FANKHAUSER
4  4830624000197              ALEX SOUZA

每个cnpj是一家公司。每个Nome Pessoa都是一个人。我想为每个出现的Nome Pessoa列出与他相同的cnpj（最好没有重复）。换句话说，我将以cnpj作为键列出人们之间的关系，以df看起来像这样（或至少接近它）的方式：

            cnpj             Nome Pessoa   Relations
0      410000132   EUGENIO LUPORINI NETO   ['JUAN MATIAS SERAGOPIAN','SIMONE FANKHAUSER','ALEX SOUZA']
1      410000132  JUAN MATIAS SERAGOPIAN   ['EUGENIO LUPORINI NETO']
2  4830624000197   EUGENIO LUPORINI NETO   ['JUAN MATIAS SERAGOPIAN','SIMONE FANKHAUSER','ALEX SOUZA']
3  4830624000197       SIMONE FANKHAUSER   ['EUGENIO LUPORINI NETO','ALEX SOUZA']
4  4830624000197              ALEX SOUZA   ['EUGENIO LUPORINI NETO','SIMONE FANKHAUSER']

例如，df['Relations'][0] = ['JUAN MATIAS SERAGOPIAN','SIMONE FANKHAUSER','ALEX SOUZA']之所以这样，是因为JUAN MATIAS SERAGOPIAN与EUGENIO LUPORINI NETO（410000132）出现在同一cnpj中，而SIMONE FANKHAUSER和ALEX SOUZA与EUGENIO（4830624000197）出现在另一个cnpj中]

我想这可能是groupby区域中的东西，但是不确定如何实现。

我在下面有这个数据框：df = pd.DataFrame（{'cnpj'：[410000132,410000132,4830624000197,4830624000197,4830624000197]，'Nome Pessoa'：['EUGENIO LUPORINI NETO'，'JUAN MATIAS SERAGOPIAN'，' EUGENIO LUPORINI ...

Answer 1

0
投票

以下作品：

Answer 2

您可以对其中的查询使用apply，并将结果附加到DataFrame：

列之间的列表关系

问题描述投票：0回答：2

2个回答

最新问题

列之间的列表关系

问题描述 投票：0回答：2

2个回答

最新问题

问题描述投票：0回答：2