nltk 相关问题

Natural Language Toolkit是一个用于计算语言学的Python库。

使用NLTK生成将推文归类为预定义类别的词典

我有一个Twitter用户列表(screen_names),我需要将其归类为7个预定义类别-教育,艺术,体育,商业,政治,汽车,技术,根据其兴趣...

回答 1 投票 0

如何通过nltk.pos_tag()函数使用通用POS标签?

我有一段文字,我想找到数量的'ADJ','PRON','VERB','NOUN'等。我知道有.pos_tag()函数,但是它给我不同的结果,我想要结果为'ADJ','PRON',...

回答 1 投票 0

如何通过nltk.pos_tag()函数使用通用POS标签?

我有一段文字,我想找到数量的'ADJ','PRON','VERB','NOUN'等。我知道有.pos_tag()函数,但是它给我不同的结果,我想要结果为'ADJ','PRON',...

回答 1 投票 0

[在Mac上使用终端安装了Matplotlib,但在Python中使用ModuleNotFoundError

我在Mac上使用终端安装了matplotlib,并且已成功安装。但是,当我尝试导入matplotlib时,会产生ModuleNotFound错误。以下是我的代码和错误...

回答 1 投票 0

如果内容匹配〜80%,则从数组中删除元素

我有一个使用nltk tokenize构建的数组数组:-[['this','is','a','long','sentence'],['another','sentence'],['this ','is','a','sentence'],['welcome','to','stack','overflow'...

回答 1 投票 0

如何将TF-IDF矩阵转换为前10个单词的整体字典

我正在尝试在一些文本上获得单词的整体tf-idf分数。我正在遵循此处介绍的计算tf-idf的手动方法:https://towardsdatascience.com/natural-language-processing -...

回答 1 投票 1


如何使用变量保存nltk Text.like()

我是nltk和python的菜鸟。最近我遇到了一个问题,我想将在终端中显示的text.similar()显示的内容保存在变量中,但失败了很多次。如何保存? text = nltk.Text(...的word.lower()...

回答 2 投票 1


具有补充自定义词典的拼写校正器

能够在外部字典中使用python进行拼写检查的最佳系统是什么?我见过使用外部词典替换....>

回答 1 投票 0

在整个句子上应用NLP WordNetLemmatizer对具有未知pos的单词显示错误

我想在整个句子上应用NLP WordNetLemmatizer。问题是我得到一个错误:KeyError:'NNP'就像Im正在获得未知的'pos'值一样,但是我不知道为什么。我想获取基本形式...

回答 1 投票 2

如何使用经过培训的Gensim模型嵌入您的数据框(GoogleNews-vectors-negative300.bin)

我正在本教程中学习,其中有Quora的以下数据集:在这里,我已经清理并标记化了q1_clean和q1_clean列中的数据。现在我已经通过...

回答 1 投票 0

使用NLTK在Python中的条件频率分布(新手)计算语料库中的单词总数

我需要使用NLTK软件包计算某些语料库中的单词(单词出现)的数量。这是我的语料库:语料库= PlaintextCorpusReader('C:\ DeCorpus','。*')这是我尝试获取总数的方法...

回答 1 投票 1

我们可以从数据框中的字段创建一个简单的同义词库吗?

我正在尝试使用数据框而不是标准wordnet.synsets词汇数据库中的字段中的字符串来查找一个单词的同义词和反义词。我很确定这是可能的,但我不是...

回答 1 投票 0

为什么在句子上使用NLTK lemmatizer时出现TypeError:无法散列的类型?

我目前正在研究如何使句子变大,同时也应用pos_tags。到目前为止,这是我从nltk.tokenize导入nltk的内容。从nltk.corpus导入word_tokenize的内容。从nltk导入wordnet的情况。...

回答 1 投票 0

NLTK:如何从csv文件创建语料库

我有一个csv文件,如col1 col2 col3每行中一些文本someID一些值一些文本someID一些值,col1对应于整个文档的文本。我想...

回答 1 投票 1

用于匹配单词中字符的正则表达式

我正在进行Pig Latin文本转换:要求之一是将qu放在一起。我所做的是re.findall(r'^ qu',token),但仅当单词/令牌以qu开头时,它才一起接受qu If ...

回答 1 投票 0

用于使用Python匹配单词中字符的正则表达式

我正在进行Pig Latin文本转换:要求之一是将qu放在一起。我所做的是re.findall(r'^ qu',token),但仅当单词/令牌以qu开头时,它才一起接受qu If ...

回答 1 投票 0

情感分析中用户输入或文本文件数据中的问题

我是Python-NLTK的新手。我已经使用电影评论数据集编写了代码。当我将硬编码的示例文本用于情感分析时,它工作正常,但是当我尝试接受用户输入或获取...

回答 1 投票 0

我在尝试查找单词频次时遇到TypeError:无法散列的类型:'list'

[我在尝试这段代码时遇到TypeError:无法散列的类型:'list':从nltk导入FreqDist fd = FreqDist()token_words = data ['tweet_split']。apply(lambda tweet:tweet.split() )...

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.