所以,今天我正在努力解决以下问题:我有一个字典,其中每个键都是一个簇号,每个值都是一个由与该簇相关的索引号组成的列表:
dic={'0':[0,1,2],'1':[3,4,5]}
我的DataFrame看起来像这样:
index col
0 foo
1 foo
2 foo
3 foo
4 foo
5 foo
我认为以下内容可行:
df['cluster']=df.index.map(dic)
但它映射到键而不是值,带来以下内容:
index col cluster
0 foo [0,1,2]
1 foo [3,4,5]
2 foo nan
3 foo nan
4 foo nan
5 foo nan
而我想要的是:
index col cluster
0 foo 0
1 foo 0
2 foo 0
3 foo 1
4 foo 1
5 foo 1
有没有其他方法可以反转我的字典来映射这个?
检查你的dict
df.index.map({y : x[0] for x in dic.items() for y in x[1]})
Out[379]: Index(['0', '0', '0', '1', '1', '1'], dtype='object')
#df['cluster']=df.index.map({y : x[0] for x in dic.items() for y in x[1]})