使用Python和Cython的工业强度自然语言处理(NLP)
我正在使用 python3 在 Windows 盒子上运行 spaCy v2.x。我没有管理员权限,所以我必须将管道称为: nlp = en_core_web_sm.load() 当我在 *nix 机器上运行相同的脚本时,我可以...
我面临一个问题,由于收到的文本中缺少空格或新行,我需要将单个“单词”拆分为两个单词。我的目的是为此任务建立一个管道(spaCy 3.5.4)...
我有一个 Excel 数据库,其中包含两列陈词滥调短语和类型。我需要检查文本文档中短语的精确匹配并返回匹配短语的类型。最好还是红色字体
我在 NLP 领域还是个新手,spaCy 是我遇到的第一个工具。 我需要从银行短信中自动检测商家名称。 例如: “在 FARMACIA 支付 4,10 欧元
如何使用 spaCy Matcher 为仅解释为单个标记的序列创建基于规则的匹配模式
我是 nlp 和 spaCy 的新手,但我正在我的项目中使用它。我正在尝试使用 spaCy 的 Matcher 类创建一个模式来从临床摘要中提取信息,特别是提到 IQ ...
通常我们从: nlp = spacy.load('en_encore_web_sm') # 或中,或大 或者 nlp = 英语() 然后: doc = nlp('我的文本') 即使不了解大自然,我们也可以从中获得很多乐趣......
我尝试使用以下命令通过 conda 安装 spacy: conda 安装-c conda-forge spacy 该软件包的安装似乎很顺利。但是当我尝试导入 spacy 时,我遇到了异常......
我正在与 spacy 合作开发命名实体识别模型(ner)。以下是包含 2 个训练句子的基本模型的代码: ner = nlp.create_pipe('ner') 标签 = ['男孩', '女孩'] 用于
通过 spacy-llm 使用 OpenAI API 时出现连接错误
我正在尝试使用 spacy-llm 包来试验各种 NLP 任务,并且很想看看通过 OpenAI API 可以获得什么结果。 但是,当我尝试运行
找不到型号“en_core_web_lg”。它似乎不是 Python 包或数据目录的有效路径。即使它们在同一目录中
我正在尝试不同的文本处理模型。我正在尝试使用 spacy,它的模型是 en_core_web_lg。 导入spacy 导入 spacy. 语言 从 spacy_langDetect 导入 LanguageDetector 来自 spacy.lang...
我如何使用示例来解决 spacy3.0 的 nlp.update 问题
我正在尝试使用 spacy v3.0 训练我的数据,显然 nlp.update 不接受任何元组。这是一段代码: 导入spacy 随机导入 导入 json nlp = spacy.blank("en&qu...
我正在用Python创建一个简历解析器算法,以提取pdf格式简历中的经历。我正在尝试检测每个体验的组织名称。 我已经尝试过默认的 spaCy NER 模式...
我正在用Python创建一个简历解析器算法,以提取pdf格式简历中的经历。我正在尝试检测每个体验的组织名称。 我已经尝试过默认的 spaCy NER 模式...
持续存在 spaCy 导入错误:NotOpenSSLWarning:urllib3 v2.0 仅支持 OpenSSL 1.1.1+
我意识到这是最近的一个常见错误,但我在网上找到的解决方案都没有帮助我。我正在尝试在 Jupyter 笔记本中使用 spaCy 并在 Mac 操作系统上使用 VScode,但每次我尝试
我正在尝试重现意大利语 spaCy 管道之一的训练:it_core_news_sm。 该管道在 2 个数据集上进行训练: conllu 任务的 UD_Italian-ISDT NET 维基百科
任何人都可以在 Colab 上工作吗?我尝试重新安装 python 3.8 但没有骰子。我尝试通过 pip 安装 medspacy 回溯(最近一次调用最后一次) 在 1 导入空间 ----&...
我已经安装了spacy的葡萄牙语包: python -m spacy 下载 pt_core_news_sm 并且还做了这样的事: python -m spacy 下载 pt 然而,对于这一行: token_transform[TGT_LANGUAGE] =
我有一个简单的数据框,由几列中的一些元数据组成,然后是一个包含句子的列。我想使用 textacy 的 SVO 提取器生成三个新列,每个列一个...
OSError:在 Python IDE 中运行脚本时无法在 spaCy 中找到模型“en_core_web_sm”
我正在尝试在使用 spaCy 库的 Python 内置 IDE (IDLE) 中运行 Python 脚本,但遇到了一个问题,它似乎找不到“en_core_web_sm”模型。 这是错误...
我有一个 pandas 数据框,如下所示: 文本ID1、文本1、其他元数据1 文本ID2、文本2、其他元数据2 文本ID3、文本3、其他元数据3 我想用新的方式将文本分成句子......