与NLP中的词干相关的查询

Question

我正在基于使用python在NLP下进行词干处理的动手任务。

下面是需要逐步执行以获取结果的任务。

我已经完成到第13步，并陷入了第14和15步（请参阅下文）。

[请帮助我了解如何执行步骤14和15。

TASK

导入文本语料库棕色。
提取与属于幽默体裁的文本集合相关的单词列表。将结果存储到变量humor_words。
将列表幽默单词中的每个单词转换为小写，并将结果存储在lc_humor_words中。
查找lc_humor_words中存在的唯一单词的列表。将结果存储在lc_humor_uniq_words。
导入语料库words。
提取与语料库单词关联的单词列表。将结果存储在变量wordlist_words。
查找wordlist_words中存在的唯一单词的列表。将结果存储在wordlist_uniq_words。
创建名为porter的PorterStemmer的实例。
创建名为lancaster的LancasterStemmer的实例。
将带有搬运工实例的每个单词出现在lc_humor_uniq_words中，并将结果存储在列表中[

使用兰开斯特实例阻止
lc_humor_uniq_words

listl_stemmed

从
p_stemmed

wordlist_uniq_words

p_stemmed_in_wordlist

从
l_stemmed

wordlist_uniq_words

l_stemmed_in_wordlist

从
lc_humor_uniq_words]中过滤单词，这些单词的长度与其在p_stemmed中出现的相应词干的长度相同，并且还包含至少一个与相应词干的字符不同的字符。将结果存储在列表中[。

从
lc_humor_uniq_words]中过滤单词，其长度与在[[l_stemmed
中出现的其对应词干相同，并且还包含至少一个与相应词干不同的字符。将结果存储在列表
l_stemmed_diff
。] >>

打印p_stemmed_diff中出现的单词数。
打印l_stemmed_diff中出现的单词数。
-下面是我在第13步之前完成的步骤。
import nltk import nltk.corpus from nltk.corpus import brown humor_words = brown.words(categories = 'humor') lc_humor_words = [w.lower() for w in humor_words] lc_humor_uniq_words = set(lc_humor_words) from nltk.corpus import words wordlist_words = words.words() wordlist_uniq_words = set(wordlist_words) from nltk.stem import PorterStemmer porter = PorterStemmer() from nltk.stem import LancasterStemmer lancaster = LancasterStemmer() p_stemmed = [] for word in lc_humor_uniq_words: p_stemmed.append(porter.stem(word)) l_stemmed = [] for wordd in lc_humor_uniq_words: l_stemmed.append(lancaster.stem(wordd)) p_stemmed_in_wordlist = [word1 for word1 in p_stemmed if word1 in wordlist_uniq_words] l_stemmed_in_wordlist = [word2 for word2 in l_stemmed if word2 in wordlist_uniq_words]

我正在使用python在NLP下基于词干进行动手操作。以下是需要逐步执行以获取结果的任务。我已经完成到第13步，并得到了...
将下面的代码用于步骤14-17
p_stemmed_diff=[] for w1,w2 in zip(lc_humor_uniq_words,p_stemmed): if len(w1) == len(w2) and w1 != w2: p_stemmed_diff.append(w1) l_stemmed_diff=[] for w1,w2 in zip(lc_humor_uniq_words,l_stemmed): if len(w1) == len(w2) and w1 != w2: l_stemmed_diff.append(w1) print(len(p_stemmed_diff)) print(len(l_stemmed_diff))

Answer 1

p_stemmed_diff=[] for w1,w2 in zip(lc_humor_uniq_words,p_stemmed): if len(w1) == len(w2) and w1 != w2: p_stemmed_diff.append(w1) l_stemmed_diff=[] for w1,w2 in zip(lc_humor_uniq_words,l_stemmed): if len(w1) == len(w2) and w1 != w2: l_stemmed_diff.append(w1) print(len(p_stemmed_diff)) print(len(l_stemmed_diff))

与NLP中的词干相关的查询

问题描述投票：-2回答：1

TASK

1个回答

最新问题

与NLP中的词干相关的查询

问题描述 投票：-2回答：1

TASK

1个回答

最新问题

问题描述投票：-2回答：1