nltk 相关问题

Natural Language Toolkit是一个用于计算语言学的Python库。

[使用doc2vec构建词汇表时将列表转换为元组

[当尝试在SQuAD 2.0数据集上训练doc2vec数据时:model_dbow = Doc2Vec(dm = 0,vector_size = 300,negative = 5,hs = 0,min_count = 2,sample = 0,worker = cores)model_dbow.build_vocab( [x for x in ...

回答 1 投票 0

仅打印python中的前25个一致性

[我正在完成我大学的一项任务,我不知道如何仅打印单词的前25个一致性而不是整个列表。

回答 1 投票 0

从zip文件夹中的所有“ .txt”和“ .docx”文件中删除标点符号和停用词

实际上我在file_list中有八个“ .txt”文件和两个“ .docx”文件。我的任务是从文件列表中的所有文件中消除所有停用词和标点符号。我只是在其中提供了部分代码...

回答 1 投票 0

搜索完全由词根列表组成的词

我是一般编码新手,现在认为这是个自学Python的好时机。我目前试图实现的是确定一个完全由...

回答 1 投票 0

试图在Python(使用nltk和flask)和html模板之间传递数据

我有一个使用NLTK和Flask创建可在本地服务器上运行的聊天机器人的Python代码。运行或执行代码后,将在本地服务器上打开html页面,并提供输入,但...

回答 2 投票 1

通过Python + RegEx改善大文档文本标记化的性能

我目前正在尝试处理大量非常大(> 10k个单词)的文本文件。在我的数据管道中,我确定gensim标记化功能为我的瓶颈,相关部分在我的...中提供。...] >>

回答 1 投票 1

为什么nltk word_tokenize即使执行nltk.download后也无法正常工作,并且所有软件包都已正确安装?

我正在使用python 3.7 64位。 nltk版本3.4.5。当我尝试使用word_tokenize将nltk.book中的text6转换为令牌时,出现错误。从nltk.tokenize导入nltk从...

回答 1 投票 0

Wordnet:获取单词的派生相关形式

[我正在从事一个IR项目,除了词干(返回不真实的单词)和词根化(可能根本不会改变单词)之外,我还需要一种替代方法,所以我在寻找一种获取...形式的方法...] >

回答 1 投票 1

如何检查是否在列表中输入

我正在尝试基于电影数据集构建建议工具。更具体地说,它将根据流派关键字按标题建议电影。但是我无法通过脚本的循环/检查部分,在这里...

回答 2 投票 2

比较列表时不可散列

我不熟悉在这里收到的无法散列的错误。我有以下要隔离角色描述的数据框“ dfd”。从那里,我将角色中的每个单词分割开...

回答 1 投票 0

我们如何在Python中创建超链接的字符串?有办法吗?

我正在使用nltk.util对构建一个聊天机器人。我正在为组合使用正则表达式!我希望回答之一是“访问Google”,其中“ Google”应该是一个超链接,应该...

回答 2 投票 0

NLTK-停用词,列表中的哈希值

我将尽我所能想象的那样,使它尽可能地易于理解,这将使令人烦恼的长期问题和烦恼成为可能。我有一条推文列表,所有推文都存储在一个名为'...

回答 2 投票 0

如何使用NLTK或pywsd进行lemmatization

我知道我的解释很长,但我认为有必要。希望有人是有耐心和乐于助人的灵魂:)我正在做一个情感分析项目atm,而我被困在预处理部分中。 ...

回答 2 投票 0

NLTK语料库:IndexError:列表索引超出范围

这里,当我运行此特定代码时,导入os导入nltk导入nltk.corpus print(os.listdir(nltk.data.find(“ corpora”)))`我得到IndexError Traceback(最新的...

回答 1 投票 -1

我应该做些什么来消除导入nltk的错误,因为我已经安装了它?

我已经安装了nltk,但现在无法正常工作,我需要协助找出问题所在。我通过pip安装它正在显示这些错误。请使用NLTK下载器获取...

回答 2 投票 -1

Text预处理Python

我有文字输入='那只棕色的狐狸。跳过了那只懒狗。我希望输出如下:[['quick','brown','fox','。'],['jumped','lazy','dog','。']]请让我知道该怎么办...

回答 1 投票 -1

使用RegexpParser提取nltk名词短语

我想从文本中提取名词短语,并且我在NLTK中使用python。我在Internet上找到一种使用RegexpParser的模式,如下所示:语法= r“”“ NBAR:{ *&...

回答 1 投票 0

在Python中相交的二元组三元组

我有一个二元组,我有一个三元组,如何匹配python中三元组中的一个二元组?我已经尝试过示例,但是我不理解,因为我是新手,非常感谢。 Bigram = [('...

回答 1 投票 -1

如何在TextBlob中指定我自己的特征提取器?

我遵循了本教程:http://textblob.readthedocs.io/en/dev/classifiers.html#feature-extractors并且我写了一个提取器:def words_extractor(document):r.extract_keywords_from_text(...

回答 1 投票 2

Nltk lemmatizers不能识别化学名称的复数形式

所以,我必须承认,我在nlp中是一个菜鸟,而且我对nltk一无所知,我只是想使用以前开发人员留下的遗留代码。我需要对词进行词素化,主要是从...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.