spacy 相关问题

使用Python和Cython的工业强度自然语言处理(NLP)

在TF-Hub上加载预训练模型,以计算Gensim或spaCy上的单词移动距离(WMD)。

我想在TensorFlow Hub嵌入上用通用句子编码器计算Word Mover's Distance,请问有没有其他方法可以将tf-Hub上的预训练模型转移到spaCy格式或word2vec格式?我试过在spaCy上用WMD-relax的例子,它从spaCy上加载'en'模型,但我 ...

回答 1 投票 1

合并同类行

我想合并一些相似的行。相似性可以通过使用spaCy来检查。df:字符串黄颜色黄颜色看起来像黄颜色鲜红色......。

回答 1 投票 0

多重实体识别与空间的python错误。

我正试图使用spacy训练多个实体 以下是我的训练数据响应=[('java开发人员与java和html css javascript', {'......)。

回答 1 投票 1

我可以将自定义令牌规则应用到spaCy中由前缀分割的令牌上吗?

我定制了一个 spaCy Tokenizer,并添加了额外的规则和前缀,分别将 w 和 f 处理为 with 和 for。前缀正确地将它们分开,但自定义规则的外稃和 ...

回答 1 投票 0

如何将SpaCy的词嵌入可视化为散点图?

SpaCy中的每个单词都用一个长度为300的向量来表示。我如何在散点图上绘制这些单词,以获得一个可视化的视角来了解任何两个单词的接近程度?

回答 1 投票 0

如何在文本中搜索可能被分开的复合短语;在python中?

假设我有一个文本,想检查它是否包含一些复合词,其中我还想包括各自的单词可能不直接接在一起的情况。例如,...

回答 1 投票 0

在python中基于regex条件提取句子。

我有一个包含9000个句子的数据集,我需要根据一些条件从这些句子中找出2020个语句。然而,当我试图匹配这些条件时,要么输出句子,要么......。

回答 1 投票 0

使用Spacy的基于模式的标点符号

作为一个测试,使用Spacy在识别span后给文本打上标点。 import spacy, en_core_web_sm from spacy.matcher import Matcher # Read input file nlp = spacy.load('en_core_web_sm') matcher ...

回答 1 投票 0

spaCy - 自定义模型的文本处理

我对机器学习和一般的NLP相当陌生。我正试图围绕如何进行适当的文本预处理(清理文本)进行思考。我已经建立了一个自定义文本分类模型, ...

回答 1 投票 1

IN属性中带有多术语条目的模式。

我正在使用规则扩展一个 spaCy 模型。在查看文档时,我注意到IN属性,它用于将模式映射到属性字典。这是很好的,但是它...

回答 1 投票 0

如何使用regex提取IP地址,使用spacy Phrase matcher。

text="Link down , Bypass (92.33.2222.88) is not ping" doc=nlp(text) pattern= [ {"TEXT": {"REGEX": "[\(][0-9]+[\.][0-9]+[\.][0-9]*[\.][0-9]*[\)]"}}] matcher=Matcher(nlp.vocab) matcher.add("ip",...)

回答 1 投票 1

我怎么能把实体(list)转换成字典呢? 我试过的代码被注释了,但不能用,NLP问题。

我怎么能把实体(list)转换为字典呢?我试过的代码被注释了,而且不工作,或者说我怎么能把实体改写成像字典一样?我想在字典中转换... ...

回答 1 投票 0

如何在SpaCy的NER中为新定义的标签添加解释说明?

我正在创建一个名为GADGET的新标签,用于识别苹果iPhone、三星电视等小工具。我如何为新标签添加自定义描述?例如,如果label='ORG' & 我们给spacy....

回答 1 投票 0

SpaCy不同的语言模型

我正在取得一些进展:)开发我的litle OCR项目。我想知道在这种情况下,我的想法是否可行! 在从图像中提取文本(OCR)后,我使用nlp(spacy)来识别两个...

回答 1 投票 0

我将微博中的词限制为内容词,现在我想将这些词转化为小写,并添加带有下划线的POS。

我写了下面的代码,并将微博中的词限制为内容词,即名词、动词和形容词,现在我想将这些词转化为小写,并添加带有下划线的POS。...

回答 1 投票 0

是否可以用自定义命名的实体来改进spaCy的相似性结果?

我发现spaCy的相似性在使用 "en_core_web_lg "开箱即用的情况下对我的文档进行比较时做得很好。我想收紧一些领域的关系,并认为添加自定义 ...

回答 1 投票 1

spacy标签的错误表示(在标记化之前和之后)。

有谁知道当在 pandas DF 上使用 spacy 时,这种输出是正常的还是无害的 (对于后续的标签 pandas DF 列的计算)(见 "错误的表示...")?代码...

回答 1 投票 0

我想再训练4个Word2vec模型,并对得到的嵌入矩阵进行平均。

我写了下面的代码,我用了Used spacy来限制tweets中的词的内容词,即名词、动词和形容词。将单词转化为小写,并将POS与......添加到一起。

回答 1 投票 0

LEMMA :: * 管道需要包括一个标记器,以便使用Matcher或PhraseMatcher。

当我试图在模式中添加一个LEMMA时,最终得到这个错误:。管道需要包含一个标签器,以便使用带有POS、TAG或LEMMA属性的Matcher或PhraseMatcher。试试...

回答 1 投票 0

Windows Docker - 在python中安装Spacy语言模型返回ImportError。DLL加载失败。找不到指定的模块

我正在构建一个基于Windows的Docker镜像来运行Flask应用。为此,我需要安装SpaCy语言模型。但我一次又一次地遇到以下问题,无法...

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.