我正在尝试创建一个Python程序,该程序将遍历用户选择的csv文件,并根据句号或换行符显示句子的总数以及所有单词的总数。
插入文件
句子总数为:3
总字数:15
重复的单词总数为:12
data = pd.read_csv('dundun.csv', sep='\t')
words = data['sentences'].str.split(expand=True)
word_count = {}
for word in words:
count = word_count.get(word, 0)
count += 1
word_count[word] = count
print(word_count)
我正在尝试此代码,但它给我计数字的输出错误我的csv看起来像:
尝试使用:
nwords = data['sentences'].str.split().map(len).sum()
nsenetences = data['sentences'].count()
nunique_words = data['senetences'].str.split().apply(lambda x: len(set(x))).sum()