使用Python和Cython的工业强度自然语言处理(NLP)
我正在尝试使用 spaCy 从文本列表中仅提取第一个发言者的姓名。目前,我的函数返回所有“PER”标签,但我想减少开销并仅获取 fi...
使用 python 包将句子从第一人称重写为第三人称,反之亦然
python中是否有任何包可以从人的角度重写大量内容,即第一人称到第三人称和第三人称到第一人称 我昨天吃了苹果 他吃了苹果是的...
错误:在 vs code 中编译程序时引发 IOError 和 OSError
OSError:[E050]找不到模型“en_core_web_sm”。它似乎不是 Python 包或数据目录的有效路径。 这是我收到的错误 我的代码: 从聊天机器人导入 ChatBot 夫...
无法访问 Berkeley Neural Parser 的终端标签
我在使用伯克利神经解析器时遇到一个非常简单的问题。我想使用 benepar 的 ._.labels 属性检索句子每个组成部分的类别标签: 进口SP...
如何在pyproject.toml文件中引用spaCy管道?
我正在为使用 spaCy 库的包(使用 setuptools 69.2.0)创建 pyproject.toml 文件。 我的目标是将 spaCy 管道下载为“pip install [package]&q...
spacy doc.char_span 每当字符串中有任何数字时都会引发错误
我试图从 spacy 训练一个模型。我将字符串及其标记偏移量保存到 JSON 文件中。 我已使用 utf-8 编码读取该文件,其中没有特殊字符。但它
我正在尝试使用 spacy 在 Python 中执行一些 nlp 操作。只是为了一些背景知识,我在带有 Intel UHD 显卡的 Windows PC 上运行(所以没有 cuda)。 我尝试安装 pytorc 的 cpu 形式...
我正在使用 SciSpaCy 的实体链接器和自定义知识库。当我更新应用程序的一些组件时(例如底层语言模型、句子标记化管道、知识......
当我尝试安装 spaCy 以与 chatterBot 一起使用时(不知怎的,它没有与 ChatterBot 一起下载),首先我收到一个错误,因为我没有将 Cython 模块安装到我的虚拟环境中,...
模式中具有可选后缀的 SpaCy Matcher 会报告同一文本的多个匹配项
使用以下匹配器规则: {'标签':'R-1', 'pattern': [{'TEXT': 'MyLabel'}, {'TEXT': ':', 'OP': '?'}], '贪婪':'最长',} 关于文本:“MyLabel:一些价值” 我得到两个匹配项:“MyLab...
我买了一台新的MacBook,并在上面安装了python 3.12.5。我正在尝试在 Jupyter Notebook 中导入并运行用于自然语言处理的库,一切都很好......除非它......
正如自我指南所说,我已经安装了它(conda环境) conda 安装-c conda-forge spacy python -m spacy 下载 en_core_web_trf 我已经安装了 spacy-transformers。但当我
我正在尝试安装 spacy,并尝试了多种使用 pip、conda 和从 git 安装的方法。但是,我遇到了同样的错误: ---------------------------------...
加载 spacy - 'en_core_web_sm' 库时出现错误
我尝试运行以下命令,它显示要求已满足,但我仍然无法加载“en_core_web_sm”。我尝试从 anaconda 提示符和 jupyter 下载该库
错误:由于环境错误而无法安装软件包:[Errno 122] 超出磁盘配额
在 slurm 上使用 scispacy、spacy 和 scispacy,而不是协作。 较小的模型(en_core_sci_sm)工作正常,大模型会抛出错误。 python 版本 - 3.9.2 点列表包括 - en-core-sci-sm 0....
在 spacy 3 中更新 ner 模型时出错,有什么建议吗?
我目前正在从 fr_core_news_lg 管道更新 NER 模型。该代码大约在一两个月前(我上次使用它时)可以工作。但现在,发生了一些事情,我不能再继续下去了。我哈...
spacy tokenizer 将 6M 分成 6 和 M,类似于 6G、6K、6T
不确定它是否认为这些是百万、万亿等的缩写 有人能告诉我是哪条规则导致了这种情况发生以及我该如何防止这种情况发生吗? 有关更多信息,其他角色不会被拆分。 到
我正在尝试对西班牙语文本进行 NLP 分析。因此,为了进行词形还原,我使用 Spacy,因为 NLTK 没有西班牙语版本的引理。 Spacy 的问题是我有限制...
Spacy 自定义名称实体识别 (NER)“灾难性遗忘”问题
模型无法记住之前训练的标签 我知道这是“灾难性的遗忘”,但似乎没有例子或博客可以帮助解决这个问题。 最常见的反应是...
我从聊天中得到了以下输入: “设置早上 7:00 的闹钟并在 Spotify 上播放 Caparezza 的歌曲。” 输入可能包含要在后端执行的多个操作。 我想根据...来划分文本