在 Rake 中使用关键字

问题描述 投票:0回答:0

#使用rake(Rapid Automatic Keyword Extraction algorithm的缩写)进行文本预处理。RAKE是一种关键词提取算法,它通过确定单词的频率及其与语料库中其他单词的相对出现来提取文本语料库中的那些关键短语。

从 Plot 中提取关键词到列表中

df['Key_words'] = '' # 初始化一个新列 r = Rake() # 使用 Rake 去除停用词

对于索引,df.iterrows() 中的行: r.extract_keywords_from_text(row['Plot']) # 提取关键词 key_words_dict_scores = r.get_word_degrees() # 获取包含关键词及其相似度分数的字典 row['Key_words'] = list(key_words_dict_scores.keys()) # 将其分配给新列

df

ı 我希望关键词应该写成一个新的冒号,但是它返回了一个查找错误,我之前没有使用过它,所以我什至不知道是什么原因

我的错误

LookupError Traceback(最后一次调用) 在 6个 7 为索引,df.iterrows() 中的行: ----> 8 r.extract_keywords_from_text(row['Plot']) # 提取关键词 9 key_words_dict_scores = r.get_word_degrees() # 获取包含关键词及其相似度分数的字典 10 row['Key_words'] = list(key_words_dict_scores.keys()) # 将其分配给新列

c:\Users\Hp naconda3\lib\site-packages ake_nltk ake.py 中的 extract_keywords_from_text(self, text) 124:param text:要从中提取关键字的文本,以字符串形式提供。 第125话 --> 126 句:List[Sentence] = self._tokenize_text_to_sentences(text) 127 self.extract_keywords_from_sentences(句子) 128

c:\Users\Hp naconda3\lib\site-packages ake_nltk _tokenize_text_to_sentences(self, text) 中的 ake.py 178 :return: 根据使用的分词器的句子列表。

python jupyter-notebook rake
© www.soinside.com 2019 - 2024. All rights reserved.