字数在数据框列中

问题描述 投票:-4回答:1

我有一个包含大约4000个客户问题的数据集。我想了解客户最常询问的主题。我没有主题列表。我想在专栏中得到一个字数。

数据位于pandas数据帧中。

python python-3.x pandas dataframe counter
1个回答
3
投票

使用空白的splitexpand=TrueDataFrame,由stack重塑并获得value_counts的排序计数:

df = pd.DataFrame({'a':['aa ss d','f d aa aa','aa']})
print (df)
           a
0    aa ss d
1  f d aa aa
2         aa

s = df['a'].str.split(expand=True).stack().value_counts()
print (s)
aa    4
d     2
f     1
ss    1
dtype: int64

对于DataFrame

df1 = (df['a'].str.split(expand=True)
              .stack()
              .value_counts()
              .rename_axis('vals')
              .reset_index(name='count'))
print (df1)
  vals  count
0   aa      4
1    d      2
2    f      1
3   ss      1
© www.soinside.com 2019 - 2024. All rights reserved.