nltk 相关问题

Natural Language Toolkit是一个用于计算语言学的Python库。

在句子列表中查找单词列表并返回匹配的句子

从句子列表和单词列表中,只有当三个单词都与单词列表(Trigrams)匹配时,如何才能返回句子列表。请提出建议。以下是示例列表。 ...

回答 1 投票 -1

用python构造字母组合,二元组和三元组

如何为大型语料库构造单字组,二元组和三元组,然后计算它们的频率。按最频繁到最不常见的克数排列结果。来自nltk ...

回答 1 投票 0

ModuleNotFoundError NLTK

令牌化工作正常,但是当我尝试执行命名实体识别namedEnt = ne_chunk(tagged,binary = True)时,出现以下错误,我确实使用pip install从cmd安装了NumPy ...

回答 1 投票 0

如果我想保留句子顺序,那么在NLTK中矢量化文本数据的最佳方法是什么?

我正在对文本数据进行分类,并希望将其输入模型中,但是我遇到了问题。我不想使用CountVectorizer,因为它不保留其结构,但也不想手动...

回答 1 投票 0

使用nltk.corpus多线程

我想在多线程环境中访问nltk.corpus.wordnet。一旦启用多线程,诸如synsets()之类的方法就会失败。如果禁用它,一切正常。错误...

回答 1 投票 0

如何修复pycharm中的“错误加载停用词”

我正在使用Pycharm,当我运行以下代码时:import nltk nltk.download('stopwords')我收到此错误消息吗? [nltk_data]加载停用词时出错:

回答 1 投票 0

ModuleErrorNotFound:没有名为'nltk'的模块

我正在尝试使用nltk编写基本脚本,该脚本已经在计算机上随pip一起安装,但是每当尝试使用顶部的import nltk运行代码时,都会不断找不到模块...

回答 1 投票 0

NLTK命名实体类别标签

关于NLTK,我一直在碰壁。我已经能够对单个文本字符串进行标记和分类,但是,如果我尝试在多行中应用脚本,则会得到标记,但是它确实...

回答 1 投票 0

文本处理:如何仅过滤单词类型的名词

flat_list = ['speed','glass','front','fond','bezel','design','pleasure','view','day','inky']我有一个类似的编码这:从nltk.corpus导入flat_list中w的wordnet:syns = wordnet ....

回答 1 投票 -2

基于NLTK的词干和词根化

我正在尝试使用lemmatizer预处理字符串,然后删除标点符号和数字。我正在使用下面的代码来做到这一点。我没有收到任何错误,但文本没有经过预处理...

回答 3 投票 1

检查Python中单词之间的相似性或同义词

我想找到单词的同义词。如果单词是高楼大厦,那么我想找到该单词的所有同义词,例如“ Spaci”等“ long apartment,large building”。导入en_core_web_sm nlp = ...

回答 1 投票 0

nltk.downloader提供xml.etree.ElementsTree.ParseError

我正在尝试构建docker映像。在执行给定命令RUN python -m nltk.downloader punkt时,构建失败,并抛出以下错误:nltk.downloader提供xml.etree.ElementsTree ....

回答 1 投票 0

NLTK将动词标识为祈使语中的名词

我正在使用NLTK POS标记器,如下所示send1 ='get me now'send2 ='run fast'tags = pos_tag(word_tokenize(sent2))打印标记[('run','NN'),('fast', 'VBD')]我发现了类似的帖子NLTK认为...

回答 2 投票 1

Python NLTK删除内部标点符号,不属于URL

我正在Python中使用NLTK,并且在尝试从文本中删除内部标点时遇到了问题,该文本在句点之后应该有一个空格,以开始一个新句子。这里有一些...

回答 1 投票 0

使用NLTK从CSV文件中提取所有名词

我对Python和NLTK都是陌生的。我想问一下如何使用nltk从CSV文件中的句子列表中提取所有名词?句子列表位于CSV文件中,格式为:* ...

回答 1 投票 -2

如何对列表中的句子使用荷兰标记器?

我设法找到了一个不错的荷兰语NLTK标记器,可以在我需要注释的文本中标记POS。我的嵌套列表如下所示:['de','oude','tovenaar','overpeinsde','zijn','leven'],['hij','...

回答 1 投票 0

停止StanfordCoreNLP从连接到StanfordCoreNLP服务器

[每当我为解析任务创建StanfordCoreNLP时,StanfordCoreNLP('stanford-corenlp-full-2020-04-20',lang ='en')我都会收到此日志记录正在初始化本机服务器... java -Xmx4g -cp“ / stanford -...

回答 1 投票 0

使用spacy训练自定义ner模型时,“ drop”和“ sgd”是什么意思?

我正在训练自定义ner模型,以在地址中标识组织名称。我的训练循环如下:-对于范围(100)中的itn:random.shuffle(TRAIN_DATA)损失= {} ...

回答 1 投票 0

我如何使用自然语言处理将一个句子分成两半?

我从未进行过自然语言处理,因此请原谅任何错误的术语。我愿意使用任何语言/库,例如NLTK或spaCy,但没有付费的API。我正在尝试制作一款游戏,其中...

回答 1 投票 0

去除关键字的困境

我在NLTK中遇到停用词功能的困境。我正在通过使用NLTK删除停用词来处理来自社交媒体平台的用户生成的内容。但是,难题是我想保留...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.