Natural Language Toolkit是一个用于计算语言学的Python库。
为什么CoreNLP ner tagger和ner tagger将分开的数字加在一起?
以下是代码片段:In [390]:t Out [390]:['my','phone','number','is','1111','1111','1111']在[391] :ner_tagger.tag(t)Out [391]:[('my','O'),('phone','O'),('number','O'),('...
我正在尝试在马达加斯加(我的母语)创建一个标记语料库。我按照Python文本处理和自然语言处理文档中的说明和https://www.nltk ....
我使用Watson Knowledge studio创建了一个自定义机器学习模型,并部署到NLU服务。我还设法在python中访问我的模型。我的自定义模型旨在识别......
如何使用单个字母字符串列表作为输入生成具有最高概率的双字节结果
我正在学习bigram主题的自然语言处理。在这个阶段,我在Python计算中遇到了困难,但我尝试了。我将使用这个未受到影响的语料库......
有没有办法用NLTK(可能还有wordnet)在单词中找到所述根的拉丁词根/定义?非常感谢!
WordNet很棒,但我很难在nltk中获取同义词。如果您在此处搜索类似于“小”的单词,则会显示所有同义词。基本上我只需要知道......
我尝试在python中使用nltk实现一个正则表达式标记生成器,但结果如下:>>> import nltk >>> text ='美国海报打印成本为12.40美元...'>>> ...
我正在尝试使用sudo pip nltk安装nltk,但是因错误而停止:目录/ users / $ username / library / caches / pip / http或其父目录不归当前用户所有...
我想用NLTK来识别日语中的特定汉字字符和汉语中的汉字字符之间的搭配。与单词搭配一样,一些汉字序列更多......
NLTK ConditionalFreqDist到Pandas数据帧
我正在尝试使用nltk.ConditionalFreqDist生成的表,但我似乎无法找到任何关于将表写入csv文件或导出为其他格式的文档。我喜欢 ...
我想知道我是否可以将它们解除为正常状态?问题是我有数千个不同形式的单词,例如吃,吃,吃,吃等等,我需要数......
我正在按照以下原始代码进行蓝色评分:来自nltk.translate.bleu_score import sentence_bleu reference = [['this','is','a','test'],['this','is' 'test']] candidate = ['this','...
我想在python enviornment中使用NLTK接口为Stanford NER,nltk.tag.stanford.NERTagger。来自nltk.tag.stanford导入NERTagger st = NERTagger('/ usr / share / stanford-ner / classifiers / ...
我正在尝试预处理单词以删除常见的前缀,如“un”和“re”,但是所有nltk的常见词干都似乎完全忽略了前缀:来自nltk.stem import PorterStemmer,...
我可以在python中使用spacy来查找特定邻居的NP吗?我希望我的文本中的名词短语在其之前和之后都有动词。
我必须以纯文本处理文档,查找单词列表并在找到的每个单词周围返回一个文本窗口。我正在使用NLTK。我在Stack Overflow上发现了他们使用常规的帖子......
我需要对每个提取的实体都有信心(不是为了打印而是为了得到它),但是,我找不到一种能够恢复信心的方法。首先,我尝试过使用Stanford Named Entity ...
如何批量训练NLTK PunktSentenceTokenizer?
我试图将财务文件分成句子。我有〜50.000个包含普通英文文本的文件。总文件大小约为2.6 GB。我正在使用NLTK的PunktSentenceTokenizer ...
我是文本挖掘的新手。我有一个CSV文件。我需要遍历每一行并提取一些信息,然后将它们写入另一个CSV文件。我正在寻找我所拥有的具体信息......
我有一个文本集合,其中的句子完全用英语或印地语或马拉地语,每个句子附加有ID,分别代表文本的语言0,1,2。 ...