将collections.counter对象的熊猫系列转换为熊猫数据框的许多列

问题描述 投票:0回答:2

我在每行中都有一系列collection.counter对象。像这样:

0       {'PRP$': 1, 'NNS': 1, 'VBP': 1, 'DT': 3, 'NN':...
1                   {'JJS': 1, 'NN': 4, 'IN': 1, 'JJ': 1}
2       {'DT': 2, 'NNS': 3, 'VBD': 1, 'TO': 1, 'VB': 1...
3          {'CD': 2, 'NNS': 3, 'JJ': 1, 'NN': 2, 'IN': 1}
4       {'RB': 1, 'VBN': 1, 'VBD': 1, 'DT': 2, 'NN': 4...
                              ...                        
7602    {'DT': 2, 'NN': 4, 'RB': 2, 'VBD': 1, 'CC': 1,...
7603    {'NNS': 2, 'VBP': 1, 'DT': 3, 'NN': 6, 'VBZ': ...
7604    {'NNS': 5, 'VBN': 2, 'IN': 1, 'NN': 4, 'JJ': 1...
7605    {'IN': 4, 'DT': 2, 'JJ': 2, 'NN': 5, 'VBP': 2,...
7606       {'JJ': 2, 'NN': 8, 'NNS': 2, 'CD': 1, 'IN': 2}

而且我想在熊猫数据框中使用这样的东西创建新列:

re-arranged_data = {'PRP$':[1,2,3...1,0],
            'NN':[1,1,1,0,...1],
            'DT':[0,0,0,0,1000],
             ...
           }

我不知道如何执行此步骤,也不知道如何将re-arranged_data添加为新列。

有帮助吗?

python pandas nlp counter pos-tagger
2个回答
0
投票

您实际上可以将其附加到数据框中将熊猫作为pd导入导入收藏集

dataframe = pd.DataFrame(columns = [“ PRP”,“ NN” ....])dataframe.append(collection.counter)


0
投票

使用df.from_records()

示例代码在这里。

import pandas as pd
from collections import Counter
a = Counter({'PRP$':1, 'NNS':1})
b = Counter({'JJS':2, 'NNS': 3})

A = pd.Series([a, b])

pd.DataFrame.from_records(A, columns = A.sum().keys())
© www.soinside.com 2019 - 2024. All rights reserved.