使用Python和Cython的工业强度自然语言处理(NLP)
在 spacy 3 中更新 ner 模型时出错,有什么建议吗?
我目前正在从 fr_core_news_lg 管道更新 NER 模型。该代码大约在一两个月前(我上次使用它时)可以工作。但现在,发生了一些事情,我不能再继续下去了。我哈...
spacy tokenizer 将 6M 分成 6 和 M,类似于 6G、6K、6T
不确定它是否认为这些是百万、万亿等的缩写 有人能告诉我是哪条规则导致了这种情况发生以及我该如何防止这种情况发生吗? 有关更多信息,其他角色不会被拆分。 到
我正在尝试对西班牙语文本进行 NLP 分析。因此,为了进行词形还原,我使用 Spacy,因为 NLTK 没有西班牙语版本的引理。 Spacy 的问题是我有限制...
Spacy 自定义名称实体识别 (NER)“灾难性遗忘”问题
模型无法记住之前训练的标签 我知道这是“灾难性的遗忘”,但似乎没有例子或博客可以帮助解决这个问题。 最常见的反应是...
我从聊天中得到了以下输入: “设置早上 7:00 的闹钟并在 Spotify 上播放 Caparezza 的歌曲。” 输入可能包含要在后端执行的多个操作。 我想根据...来划分文本
我正在从事一个用于情感分析的 NLP 项目。我正在使用 SpaCy 来标记句子。当我阅读文档时,我了解了 NER。我读到它可以用来提取实体...
在我的 NLP 项目中,我构建了自己的模型来识别 PDF 文档中的句子。现在我想检查我提取的句子是否是完整的句子。在我的研究过程中,我已经发现...
我正在尝试使用 spacy 为文章进行自定义 NER;但是当我开始训练模型时,我收到错误消息: “[E088] 长度为 1021312 的文本超出最大值 1000000....” 尝试过
我正在使用 Python 和 Spacy 进行编码。 我想跟踪 nlp.pipe(sentences) 的执行进度,因为它持续很长时间。 怎么做? nlp = spacy.load('en_core_web_sm') 句子 = [...] d...
我如何修改 Spacy English tokenizer,以便它能够分割并分割特定的标点符号对: 导入spacy nlp = spacy.load('en_core_web_md') doc = nlp("正在运行。(到...
我有一台支持 GPU 的机器。 操作系统:Ubuntu 20.04.6 LTS NVCC版本:12.2 Nvidia 驱动程序版本:535.183.01 Pytorch版本2.3.1+cu121 spaCy 版本 3.7.5 Python 版本 3.8.10 管道:en_core_...
我正在使用 INCEpTION 0.11.0 (https://inception-project.github.io/) 来注释我的训练数据。 我想使用 python spacy 来使用这个训练数据。 我可以在 Incept 中看到几种格式...
如何将 INCEpTION 带注释的文本 NER 转换为 spaCy? (CoNLL-U 到 json)
我正在使用 INCEpTION 来注释命名实体,我想用它来通过 spaCy 训练模型。 INCEpTION 中有多种选项(例如 CoNLL 2000、CoNLL CoreNLP、CoNLL-U)来导出注释...
请建议将文本转换为过去时态的最佳方法。 我尝试将 spacy 与“en_core_web_sm”模型一起使用,但效率不是很高。 文本 - 文本=“t的主要目的...
我将介绍一下项目环境,以便您了解一些背景信息来帮助我。 我正在尝试解析 pdf 格式的德国组织结构图信息。对吧...
错误:由于操作系统错误而无法安装软件包:[WinError 5] 访问被拒绝:检查权限[重复]
我想在虚拟环境中安装Spacy。我用 python 3.9 创建了虚拟环境。激活了环境。根据 Spacy 教程,当我尝试在虚拟中安装 Spacy
我想在虚拟环境中安装Spacy。我用 python 3.9 创建了虚拟环境。激活了环境。根据 Spacy 教程,当我尝试在虚拟中安装 Spacy
我正在尝试构建一个模型,使用转录的音频和屏幕文本将视频广告分类为政治或非政治,并提取候选人和赞助商的姓名。怎么可以...
我正在尝试研究一种方法来修复(或改变)spaCy 识别动词/名词的方式。在下面的示例中,我想将手指识别为名词而不是动词。 导入spacy nlp = spacy.load(&q...
我在寻找正确的方法来注释我的数据时遇到了一些麻烦。我正在处理与实验室测试相关的文本,并且使用以下标签: 1) 测试规格(如电压、长度...