试图从包含阿拉伯语句子的csv文件中删除停用词,但我不确定我有很多错误
我的代码
print(tokenized_docs_no_punctuation)
stops = set(stopwords.words('arabic'))
words=tokenized_docs_no_punctuation
print([word for word in words if word not in stops])
任何想法或解决方案?
TypeError: unhashable type: 'list'
的错误表明您正在尝试对list
对象进行哈希处理。根据您在问题中发布的代码,似乎set(stopwords.words('arabic'))
引起了错误,因为set
函数试图对参数进行哈希处理以查找重复项。查看stopwords.words('arabic')
输出,并确保输出中没有list
对象。