对于下面的给定数据框。我想知道对于X中的每个索引(即1,2和3),其他索引Y中的值是否相同并且总数相同。因此,对于X索引1,我想知道Y中分别是a,b和c的值。以及它是否等于2和3的Y的索引值。因此,此处X索引1的Y值等于X索引3的Y值,即它们都具有a,b和c,而3则不相同。
X Y
1 a A
b B
c C
2 a A
b B
3 a A
b B
c D
我相信您需要:
print (s.unstack())
Y a b c
X
1 A B C
2 A B NaN
3 A B D
df1 = s.unstack().dropna()
print (df1)
Y a b c
X
1 A B C
3 A B D
print (df1.columns.tolist())
['a', 'b', 'c']
print (len(df1))
2