如何根据ID忽略数据帧中的null和None值并对数据进行构架。
id A B C
1 [] [] []
1 [aaaa] None []
1 [] [bbbb] None
1 [] [] [ccccc]
1 None [] []
2 [] [] [zzzz]
2 [] None []
2 [xxxx] None None
2 [] [] []
2 none [yyyy] None
我们可以根据ID重新排列数据集。
输出:
id A B C
1 aaa bbb ccc
2 xxx yyy zzzz
用途:
df = (df.set_index('id')
.apply(lambda x: x.str[0]).mask(lambda x: x.isna(), np.nan)
.groupby('id')
.first())
print (df)
A B C
id
1 aaaa bbbb ccccc
2 xxxx yyyy zzzz