我在pandas数据框中有一列,其中包含单词袋的字典(键=单词,值=文档中的计数)。每个字典是唯一的(文档是唯一的),但是可能有一些共享密钥。
我想获得语料库中所有单词计数的直方图。换句话说,我需要获取所有行的所有唯一键,然后对它们的值求和。
字典部分让我失望。我该怎么办?
big_dict = {}
for d in your_dataframe['your_column']:
for k in d:
if k in big_dict:
big_dict[k] += d[k]
else:
big_dict[k] = d[k]