spacy 相关问题

使用Python和Cython的工业强度自然语言处理(NLP)

没有标点符号的句子分词

我想对没有标点符号的句子进行分词,代码如下: 导入 nltk def segment_sentences(文本): # 如有必要,下载 Punkt 分词器 nltk.downl...

回答 0 投票 0

ent.sent.text in spacy 返回标签而不是 NER 问题的句子

我正在尝试使用 PDF 文件的 SpaCy 解决名称实体识别(NER)问题。我想从 pdf 文件中获取情态动词(will、shall、should、must 等)。 我在 sp 中训练了数据...

回答 0 投票 0

导入“spacy”无法解决 Pylance(reportMissingImports)

我是python的新手,在构建良好的工作目录方面没有太多经验。但根据我过去通过 pip 使用已安装软件包的经验,我没有遇到任何问题。 我很...

回答 3 投票 0

使用文本提取引语

我试图从文本中提取引文和引文属性(即说话者),但出现错误。这是设置: 导入文本 将熊猫导入为 pd 导入空间 数据 = [...

回答 2 投票 0

如何在维护构成每个句子的字符串的信息的同时对字符串列表进行句子标记?

我有如下字符串列表(从 pdf 上的 OCR 找到),对于列表中的每个字符串,我也有它们在 pdf 中的位置坐标 [“新加坡的大部分基础设施......

回答 1 投票 0

在非常精确的数值环境中找到相似性

我有一个包含 100 多个句子的列表,我需要找到最接近用户提示的句子。 问题是我们正在处理非常精确、细微的提示,因为我们分析的是数字数据。 举个例子……

回答 0 投票 0

我想将 errant 与 spacy v3 一起使用...errant 不适用于 spacy v3

errant 想要 'en' 模块工作,即 errant.load('en') 并且在 spacy v3 中没有 'en' 模块 我试图将 spacy 降低到版本 2 然后仍然有同样的问题。

回答 1 投票 0

SpaCy - 术语在哪里定义?

有GPE、ROOT、LOC等术语,但是它们在SpaCy文档中的什么地方定义的呢? ChatGPT 说: 在 SpaCy 中,GPE 代表“地缘政治实体”。它是一个命名实体标签...

回答 1 投票 0

为 Transformer 的 GPU 训练安装 Spacy

我还安装了 CudaToolkit 和 cuDNN。 我有以下 显卡: | NVIDIA-SMI 531.68 驱动程序版本:531.68 CUDA 版本:12.1 | |--------------------------------...

回答 0 投票 0

不确定为什么我使用 Spacy 添加 phone_number 实体的 Python 代码不起作用

模式与匹配器一起工作。但不是作为一个实体?这是我的代码: 导入空间 从 spacy.pipeline 导入 EntityRuler nlp = spacy.load("en_core_web_sm") 模式 = [ { ...

回答 0 投票 0

使用不同类型的数据集持续训练我的自定义运行模型

我对 spacy python 和训练 ml 模型完全陌生。所以我的问题是 我怎样才能让我的模型每次都运行并为该模型提供我的训练数据集并完全生成一个新的 m...

回答 0 投票 0

嗨,我收到了这个 TypeError: dataclass_transform() got an unexpected keyword argument 'field_specifiers?

文件 ~ naconda3\lib\site-packages\pydantic_init_.py:2, 在初始化 pydantic.init() 文件 ~ naconda3\lib\site-packages\pydantic\dataclasses.py:48,在 init pydantic.dataclasses() 文件 ~ naconda3\lib\site-

回答 0 投票 0

尝试处理 PDF 和 DOCX 文件时出现 Spacy 和 Srsly 错误”或“使用 Spacy 和 Srsly 处理文档时出现 ExtraData 错误

我正在尝试使用 Spacy 对文档进行分类,但在尝试读取我的文件时,我不断收到“ExtraData”错误。我正在使用 Python 3.9 和 Spacy 3.1.1。我怎样才能解决这个错误并成功......

回答 0 投票 0

在 python 中使用 NLP 查找表示时间顺序的单词

我想在 python 中使用 NLP 查找所有指示时间的单词。在英语中也称为时序词。这包括“晚上”“早晨”“第一”“5点”等作品。我找不到...

回答 1 投票 0

如何在可公开访问的服务器上运行 Spacy 模型?

我正在用 python 运行一个语言分析程序。我的本地主机上已经运行了以下代码: 从烧瓶导入烧瓶,请求,jsonify,render_template 导入 en_core_web_sm 来自...

回答 1 投票 0

在 python 中使用 NLP 查找所有表示时间的词

我想在 python 中使用 NLP 查找所有指示时间的单词。在英语中也称为时序词。我无法找到一种方法来做到这一点,而不必列出电子中的每个时间顺序词......

回答 0 投票 0

SpaCy textcat,如何访问训练精度?

我无法阅读 SpaCy 的文档(非 comp-sci/soft-eng 背景),并且互联网上没有足够的教程让我弄清楚如何使用 SpaCy。 我想要...

回答 0 投票 0

阻止 spacy 删除拆分字符串中的停用词

我正在尝试使用 spacy 从 csv 创建的熊猫数据框中删除停用词。 我的问题是我正在尝试解释可能包含单词和数字的单词。 我的问题: 如果一个女...

回答 1 投票 0

如何根据与 SpaCy 的依赖关系获取部分子树?

我用SpaCy解析了一些文本的依赖关系。在提取给定标记/跨度的子树时,如何施加与这些依赖关系相关的条件? 比如我...

回答 0 投票 0

在 spaCy 的词汇表中使用哈希表存储字符串有什么优势?

为什么不直接将键的字典作为字符串并将它们的值作为它们的属性/特性呢?是时间复杂度优势,还是也有节省内存的优势? 我有一个

回答 0 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.