从groupby对象Python创建一个字典

Question

假设我有一个数据帧：

df = pd.DataFrame({'Type' : ['Pokemon', 'Pokemon', 'Bird', 'Pokemon', 'Bird', 'Pokemon', 'Pokemon', 'Bird'],'Name' : ['Jerry', 'Jerry', 'Flappy Bird', 'Mudkip','Pigeon', 'Mudkip', 'Jerry', 'Pigeon']})

我根据类型分组：

print df.groupby(['Type','Name'])['Type'].agg({'Frequency':'count'})

                           Frequency
Type    Name                  
Bird    Flappy Bird          1
        Pigeon               2
Pokemon Jerry                3
        Mudkip               2

我可以从上面的组创建一个字典吗？密钥"Bird"将具有包含['Pigeon',Flappy Bird']的列表值，请注意，更高频率名称应首先出现在值列表中。

预期产出：

dict1 = { 'Bird':['Pigeon','Flappy Bird'] , 'Pokemon':['Jerry','Mudkip'] }

Answer 1

您可以使用字典理解创建字典，如下所示

df = pd.DataFrame({'Type' : ['Pokemon', 'Pokemon', 'Bird', 'Pokemon', 'Bird', 'Pokemon', 'Pokemon', 'Bird'],'Name' : ['Jerry', 'Jerry', 'Flappy Bird', 'Mudkip','Pigeon', 'Mudkip', 'Jerry', 'Pigeon']})  
f = df.groupby(['Type','Name'])['Type'].agg({'Frequency':'count'})
f.sort('Frequency',ascending=False, inplace=True)

d = {k:list(f.ix[k].index) for k in f.index.levels[0]}
print(d)
# {'Bird': ['Pigeon', 'Flappy Bird'], 'Pokemon': ['Jerry', 'Mudkip']}

字典理解将遍历外部索引（'Bird'，'Pokemon'），然后将值设置为字典的内部索引。

有必要首先通过MultiIndex列对Frequency进行排序，以获得您想要的排序。

Answer 2

这是一个单行。

df.groupby(['Type'])['Name'].apply(lambda grp: list(grp.value_counts().index)).to_dict()

# output
#{'Bird': ['Pigeon', 'Flappy Bird'], 'Pokemon': ['Jerry', 'Mudkip']}

value_counts函数隐式地将Name字段按count分组，并默认返回降序。

奖励：如果您想包括计数，您可以执行以下操作。

df.groupby(['Type']).apply(lambda grp: grp.groupby('Name')['Type'].count().to_dict()).to_dict()

# {'Bird': {'Flappy Bird': 1, 'Pigeon': 2}, 'Pokemon': {'Jerry': 3, 'Mudkip': 2}}

从groupby对象Python创建一个字典

问题描述投票：11回答：2

2个回答

最新问题

从groupby对象Python创建一个字典

问题描述 投票：11回答：2

2个回答

最新问题

问题描述投票：11回答：2