使用Python和Cython的工业强度自然语言处理(NLP)
我有这句话:从spacy.matcher import导入spacy nlp = spacy.load('en_core_web_sm')Matcher matcher = Matcher(nlp.vocab)doc = nlp(u'Non-产生收入的采购订单支出......
spacy.load的ValueError('en_core_web_sm')
我得到了ValueError:无法将形状(96)的输入数组广播到spacy.load('en_core_web_sm'的形状(128)中我手动下载并安装了模型,因为我正在处理工作...
我正在尝试使用python 3中的spacy从文本中提取语言特征。我的输入看起来像这样Sent_id文本1我正在使用spacy 2探索文本分析惊人的spacy将帮助我...
如何使用Spacy PhraseMatcher解决内存错误?
高级背景我正在开发一个项目,在第一步中我在大文本语料库中搜索关键词和短语。我想识别这些关键字的段落/句子......
我打算用spacy和textacy来识别英语中的句子结构。例如:猫坐在垫子上 - SVO,猫跳起来拿起饼干 - SVV0。猫吃了饼干......
在python 3.7中安装spacy-readability时出错
我在安装spacy-readability时遇到问题。它给我以下错误:命令“”c:\ program files(x86)\ python37-32 \ python.exe“”c:\ program files(x86)\ python37-32 \ lib \ site-packages \ pip“in ...
我正在使用非常大的短文本集合,我需要注释并保存到磁盘。理想情况下,我想将它们保存/加载为spaCy Doc对象。显然我不想保存语言或......
我有一个问题,我想知道如何根据在句子中使用它的上下文提取或命名实体。例如:如果我们必须提取日期字段,那是...
对于许多令牌属性,例如词性和依赖关系,spaCy存储整数和字符串属性。例如,对于POS,有pos_(字符串,如“PUNCT”和“ADJ”)和pos(...
培训Spacy v2.0.11的“en_core_web_sm”模型失败
我正在尝试使用以下代码训练en_core_web_sm模型以添加新实体EMAIL:LABEL =“EMAIL”TRAIN_DATA = [(“我的电子邮件地址是[email protected]”,...
使用spacy和textacy。需要在原始推文的语料库中找到tf-idf得分,但无法导入文本向量化
我是这些框架以及NLP的新手。我正在按照一个示例给出以下代码片段来计算推文中所有令牌的tf-idf分数。但是我一直在......
spaCy共指消解 - 命名实体识别(NER)返回唯一实体ID?
也许我已经跳过了部分文档,但我想确定的是标准NER工具集中每个实体的唯一ID。例如:从spacy import displacy import导入spacy ...
我做了以下函数来清理我的数据集的文本注释:import spacy nlp = spacy.load(“en”)def clean(text):“”“英文文本的文本预处理”“”#将spacy应用于...
TypeError:'spacy.tokens.token.Token'类型的参数不可迭代
我需要检查句子的主题是否存在于列表中,但我对此错误有一些问题,我不明白如何修复它__init __(self,user_input):personal_words = [“...
我需要提取一个人的电子邮件地址。我已经在Spacy中训练了NER模型,但有一些例子,但没有运气。必须通过数千个示例进行训练才能获得令人满意的结果。所以我 ...
spacy noun-chunking创建了意想不到的引理,pos,tag和dep
我正在使用spacy来解析文档,不幸的是我无法按照我预期的方式处理名词块。下面是我的代码:#import spacy import spacy nlp = spacy ....
我知道SpaCy中内置的noun_chunks。然而,它并不完全适合我所处的位置。举个例子 - 天网将很快退役。这是一个 ...
我正在制作一个依赖于spacy的Python包。 Spacy使用二进制语言模型。所以我的需求末尾列出了URL .txt https://github.com/explosion/spacy-models/releases / ...
我一直在使用spacy来查找句子的NER。我的问题是我必须计算两个不同文档的句子之间的NER相似性。是否有任何配方或包装......