nltk 相关问题

Natural Language Toolkit是一个用于计算语言学的Python库。

Windows 10- python 3.6 - 安装nltk

Windows 10上的Python 3.6在尝试导入nltk时发现错误:>>> import nltk Traceback(最近一次调用最后一次):文件“ “,第1行,in 进口......

回答 1 投票 0

将nltk树转换为JSON表示

我想将以下nltk树表示转换为JSON格式:所需输出:{“score”:{“填充”:[[“得分]],...

回答 4 投票 2

pip install安装NLTK时的SyntaxError

我在Python 2.7上编码。我想要一个可以访问的大量单词列表。环顾四周,我发现nltk有我正在寻找的东西。但是,每次我尝试安装它时,我都会得到一个语法...

回答 2 投票 0

IOB精度和精度之间的差异

我正在做NLTK的一些有关命名实体识别和chunkers的工作。我使用nltk / chunk / named_entity.py重新训练了一个分类器,我得到了以下信息:ChunkParse得分:IOB ......

回答 1 投票 3

nltk pos_tag用法

我正在尝试在NLTK中使用语音标记并使用此命令:>>> text = nltk.word_tokenize(“现在用于完全不同的东西”)>>> nltk.pos_tag(text)Traceback(...

回答 3 投票 8

如何使用NLTK计算WordNet中最深的节点?

是否有内置功能可以使用NLTK查找单词层次结构中的最低单词?例如,如果在http:// www ....的第一张图中“胎盘”和“食肉动物”之间没有边缘。

回答 1 投票 0

TypeError:不可用类型:python nltk中的'list'

我有这个代码:从nltk.corpus导入来自nltk.tokenize的停止词从nltk.stem导入word_tokenize导入PorterStemmer import re fo = open('cran.all.1400','r +')contents = fo.read()docs = ...

回答 2 投票 0

django序列化数据提取名词

我试图在我的django rest应用程序中使用nltk来提取名词坏动词:我的WIP功能如下所示:@api_view(['GET'])def测试(请求):verbs = [] tasks = Task.objects .. ..

回答 1 投票 1

如何分析sklearn中tfidf矩阵的值?

我正在使用sklearn的KMeans算法进行文档聚类,如http://brandonrose.org/clustering中所述。这是TFIDF矩阵的计算。我理解TFIDF背后的概念......

回答 1 投票 4

如何对句子列表进行词形推理

我怎样才能将Python中的句子列表变为lematize?来自nltk.stem.wordnet导入WordNetLemmatizer a = ['我喜欢汽车','猫是最好的'] lmtzr = WordNetLemmatizer()lemmatized = [lmtzr.lemmatize(...

回答 2 投票 0

如何保持一个高度相关的变量在scikit-learn中淹没其余部分?

我正在建立一个分类器来检测唐纳德特朗普何时从@realDonaldTrump而不是员工发推文。它使用2016年的推文来训练模型,使用推文设备来推断......

回答 1 投票 2

如何将nltk.tree生成的数组转换为另一棵树?

我有一个由nltk.tree制作的列表.Tree >>>问题''碧昂丝什么时候开始变得流行?' >>> questionSpacy = spacy_nlp(问题)>>> print(questionSpacy)[树('...

回答 1 投票 1

变量实体提取 - 句子实体中没有模式 - NLP

我正在开发一个客户支持机器人,它可以帮助业务用户理解某些技术术语的含义或某些请求的状态。一个典型的句子如下所示解释我...

回答 2 投票 0

NLTK文本分类信心朴素贝叶斯

我开发了一个文本分类脚本,非常类似于nltk书的第6章中的示例。我想将客户的回复归类为“订购”,“结算”等等。我有......

回答 1 投票 0

预期字符串或字节类似对象错误

从nltk import word_tokenize,sent_tokenize text = data.loc [:,“text”] tokenizer = word_tokenize((text))print(tokenizer)我试图在...上的特定列上执行word tokenizer

回答 1 投票 0

AttributeError:'list'对象没有属性'isdigit'。有效地指定句子列表中每个单词的POS?

假设我将句子列表(在大型语料库中)列为标记化单词的集合。样本格式如下:tokenized_raw_data的格式如下:[['arxiv',':',...

回答 1 投票 1

如果字符串包含停用词,请从字符串中删除元素[复制]

我有一个列表如下:lst = ['for Sam','just in','Mark Rich']我试图从字符串列表中删除一个元素(字符串包含一个或多个单词),其中包含停用词。作为第1和第2 ......

回答 2 投票 1

使用Python计算N Grams

我需要计算Unigrams,BiGrams和Trigrams的文本文件,其中包含以下文字:“囊性纤维化仅影响美国30,000名儿童和年轻人,吸入盐雾......

回答 8 投票 20

re.sub错误与“预期字符串或字节类对象”

我已阅读有关此错误的多篇帖子,但我仍然无法弄明白。当我尝试循环我的函数时:def fix_Plan(location):letters_only = re.sub(“[^ a-zA-Z]”,#搜索...

回答 1 投票 21

NLTK fcfg语法解析器超出索引

我是NLTK的新手。试图将“给我看电影”转换成一个简单的SQL SELECT语句“从电影中选择标题”。我相信句子是(VP + NP)与VP(V + PRO)和NP(DET + N)。但是......

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.