nltk 相关问题

Natural Language Toolkit是一个用于计算语言学的Python库。

为什么CoreNLP ner tagger和ner tagger将分开的数字加在一起?

以下是代码片段:In [390]:t Out [390]:['my','phone','number','is','1111','1111','1111']在[391] :ner_tagger.tag(t)Out [391]:[('my','O'),('phone','O'),('number','O'),('...

回答 1 投票 2

使用NLTK创建和利用标记的语料库

我正在尝试在马达加斯加(我的母语)创建一个标记语料库。我按照Python文本处理和自然语言处理文档中的说明和https://www.nltk ....

回答 1 投票 0

如何为API响应中的单词指定编号

我使用Watson Knowledge studio创建了一个自定义机器学习模型,并部署到NLU服务。我还设法在python中访问我的模型。我的自定义模型旨在识别......

回答 1 投票 0

如何使用单个字母字符串列表作为输入生成具有最高概率的双字节结果

我正在学习bigram主题的自然语言处理。在这个阶段,我在Python计算中遇到了困难,但我尝试了。我将使用这个未受到影响的语料库......

回答 1 投票 0

查找拉丁语/希腊语单词Roots NLTK [关闭]

有没有办法用NLTK(可能还有wordnet)在单词中找到所述根的拉丁词根/定义?非常感谢!

回答 1 投票 2

如何从nltk WordNet Python中获取同义词

WordNet很棒,但我很难在nltk中获取同义词。如果您在此处搜索类似于“小”的单词,则会显示所有同义词。基本上我只需要知道......

回答 5 投票 25

nltk正则表达式标记生成器

我尝试在python中使用nltk实现一个正则表达式标记生成器,但结果如下:>>> import nltk >>> text ='美国海报打印成本为12.40美元...'>>> ...

回答 1 投票 6

nltk安装说目录不属于当前用户和要求已经是最新的

我正在尝试使用sudo pip nltk安装nltk,但是因错误而停止:目录/ users / $ username / library / caches / pip / http或其父目录不归当前用户所有...

回答 1 投票 0

如何使用Python NLTK识别单个字符之间的搭配?

我想用NLTK来识别日语中的特定汉字字符和汉语中的汉字字符之间的搭配。与单词搭配一样,一些汉字序列更多......

回答 1 投票 8

NLTK ConditionalFreqDist到Pandas数据帧

我正在尝试使用nltk.ConditionalFreqDist生成的表,但我似乎无法找到任何关于将表写入csv文件或导出为其他格式的文档。我喜欢 ...

回答 3 投票 4

如何在Python中取消单词?

我想知道我是否可以将它们解除为正常状态?问题是我有数千个不同形式的单词,例如吃,吃,吃,吃等等,我需要数......

回答 5 投票 7

NLTK:TypeError:不可用类型:'list'

我正在按照以下原始代码进行蓝色评分:来自nltk.translate.bleu_score import sentence_bleu reference = [['this','is','a','test'],['this','is' 'test']] candidate = ['this','...

回答 1 投票 0

如何安装和调用Stanford NERTagger?

我想在python enviornment中使用NLTK接口为Stanford NER,nltk.tag.stanford.NERTagger。来自nltk.tag.stanford导入NERTagger st = NERTagger('/ usr / share / stanford-ner / classifiers / ...

回答 5 投票 6

Python nltk词干分析器永远不会删除前缀

我正在尝试预处理单词以删除常见的前缀,如“un”和“re”,但是所有nltk的常见词干都似乎完全忽略了前缀:来自nltk.stem import PorterStemmer,...

回答 2 投票 1

Spacy提取特定的名词短语

我可以在python中使用spacy来查找特定邻居的NP吗?我希望我的文本中的名词短语在其之前和之后都有动词。

回答 2 投票 4

Python:查找文本中的单词列表并返回其索引

我必须以纯文本处理文档,查找单词列表并在找到的每个单词周围返回一个文本窗口。我正在使用NLTK。我在Stack Overflow上发现了他们使用常规的帖子......

回答 4 投票 2

命名实体识别信心

我需要对每个提取的实体都有信心(不是为了打印而是为了得到它),但是,我找不到一种能够恢复信心的方法。首先,我尝试过使用Stanford Named Entity ...

回答 1 投票 1

如何批量训练NLTK PunktSentenceTokenizer?

我试图将财务文件分成句子。我有〜50.000个包含普通英文文本的文件。总文件大小约为2.6 GB。我正在使用NLTK的PunktSentenceTokenizer ...

回答 1 投票 3

从python中的文本中提取信息

我是文本挖掘的新手。我有一个CSV文件。我需要遍历每一行并提取一些信息,然后将它们写入另一个CSV文件。我正在寻找我所拥有的具体信息......

回答 1 投票 0

在Python中清除属于不同语言的文本

我有一个文本集合,其中的句子完全用英语或印地语或马拉地语,每个句子附加有ID,分别代表文本的语言0,1,2。 ...

回答 1 投票 3

© www.soinside.com 2019 - 2024. All rights reserved.