使用熊猫计算csv中的句子和单词

问题描述 投票:0回答:1

我正在尝试创建一个Python程序,该程序将遍历用户选择的csv文件,并根据句号或换行符显示句子的总数以及所有单词的总数。

插入文件

句子总数为:3

总字数:15

重复的单词总数为:12

data = pd.read_csv('dundun.csv', sep='\t')
words = data['sentences'].str.split(expand=True)
word_count = {}
for word in words:
    count = word_count.get(word, 0)
    count += 1
    word_count[word] = count
print(word_count)

我正在尝试此代码,但它给我计数字的输出错误我的csv看起来像:

enter image description here

python pandas csv word-count
1个回答
0
投票

尝试使用:

nwords = data['sentences'].str.split().map(len).sum()
nsenetences = data['sentences'].count()
nunique_words = data['senetences'].str.split().apply(lambda x: len(set(x))).sum()
© www.soinside.com 2019 - 2024. All rights reserved.