spacy 相关问题

使用Python和Cython的工业强度自然语言处理(NLP)

使用spacy(python)的文档相似性

sent1 = nlp(“我很高兴”)send2 = nlp(“我很悲伤”)send3 = nlp(“我很高兴”)在这里,有三个句子我想比较相似之处,显然send1应该更加相似...

回答 1 投票 0

如何从Spacy库的哈希值中获取字符串?

我正在使用spaCy库进行自然语言处理。如何从哈希中取回字符串值?这是我的代码,其中包含带有spaCy库的python中的详细信息注意-此问题...

回答 1 投票 0

将NLP依赖关系树转换为二进制树?

Spacy(以及Core NLP和其他解析器)输出的依存关系树可以包含不同数量的子级。例如,每个节点都有一个.lefts和.rights关系(多个left ...

回答 1 投票 0

如何检查单词是否具有矢量表示形式,并且python中的List表达式是否具有'if,if else'格式

我正在做一个NLP项目,在这里我试图在两个列表之间找到相似的项目。在进行相似度比较之前,我想检查特定单词是否存在矢量形式。我...

回答 1 投票 0

正在pyspark中运行spacy,但是得到ModuleNotFoundError:没有名为'spacy'的模块

我在cmd窗口中设置了venv并运行了'conda list',我可以看到spacy 2.2.4,en-core-web-sm 2.2.5,pyspark 2.4.5等软件包。我想将spacy的命名实体识别应用于...

回答 1 投票 -1

字典中的SpaCy实体(NLP)(NER)

[好,我正在研究OCR项目,并从基于ocr的文本文件中找到的实体中创建了一个dic。第一步运行良好。 “读取”图像后,我得到了一个带有txt文件的文件夹...

回答 1 投票 0

换行时的Spacy自定义句子分割

我正在尝试将此文档分成几段。具体来说,我想在出现换行符( )时拆分文本。这是我正在使用的代码,但未产生结果...

回答 1 投票 0

用于训练阿拉伯spacy NER模型的Python代码未给出结果或错误

这是为NER训练spacy模型的代码。我的数据集是阿拉伯文推文JSON文件。我使用https://dataturks.com机器学习工具在数据集中手动标记了位置,但是代码...

回答 1 投票 -1

通过pos_tag过滤SpaCy noun_chunks

正如subj行所说,我正在尝试根据单个POS标签提取noun_chunks的元素。似乎noun_chunk的元素无法访问全局语句POS标签。到...

回答 1 投票 0

机器学习的数据注释

我将开发一个机器学习模型。我有大量数据集(文本)。我需要总体上更好的准确性F1得分等。我正在使用数据注释工具(Dataturks)。哪种方法适合...

回答 1 投票 0

如何将Spacy模型添加到requirements.txt文件?

我有一个使用Spacy模型“ en_core_web_sm”的应用。我已经在本地计算机上测试了该应用程序,并且运行良好。但是,当我将其部署到Heroku时,它给了我这个错误:“找不到模型'...

回答 1 投票 0

使用NLTK(5400)和Spacy(5300)的句子计数给出不同的答案。需要知道为什么吗?

我是NLP的新手。使用Spacy和NLTK来计数JSON文件中的句子,但是两个答案都有很大的不同。我以为答案是一样的。有人可以告诉我吗? ...

回答 1 投票 0

如何向自定义聊天机器人赋予默认意图

我正在使用Tensorflow和spacy构建自定义的意图分类聊天机器人。我无法弄清楚如何在没有意图的情况下提供默认意图。我尝试了谷歌搜索,但所有内容都...

回答 1 投票 -2

西班牙语英语模型加载时间太长

我正在尝试使用python创建聊天机器人,为此我正在使用Spacy进行实体识别,因此我已经安装了预构建的Spacy英语模型(中)以从用户中提取实体...

回答 1 投票 0

Spacy Entityruler的正则表达式模式不起作用

我正在尝试使用正则表达式识别实体,并使用实体标尺标记它们。正则表达式模式为Matcher返回一个匹配项,但为实体标尺返回一个不匹配项,并且也可以在常规正则表达式中使用。 ...

回答 1 投票 0

如何检测需要单位的实体? [关闭]

我正在编写代码以检测文本中需要单位的所有实体。例如,如果我们输入的文本为“查找埃菲尔铁塔的高度”,则它应检测到高度要求单位。 ...

回答 1 投票 0

Python:Spaner NER和内存消耗

我使用SPACY进行命名实体识别。我在en_core_web_md上拥有自己训练有素的模型。我的模型的大小为223 MB。将模型加载到内存后,它将使用800兆字节。是...

回答 1 投票 0

检查Python中单词之间的相似性或同义词

我想找到单词的同义词。如果单词是高楼大厦,那么我想找到该单词的所有同义词,例如“ Spaci”等“ long apartment,large building”。导入en_core_web_sm nlp = ...

回答 1 投票 0


具有SpaCy的合法名称和昵称

我希望在给定文本中显示单词出现的图表。上面的代码运行良好,但是将“ Mathew”和“ Mat”视为两个不同的词。如何使SpaCy视为相同...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.