使用Python和Cython的工业强度自然语言处理(NLP)
我想对没有标点符号的句子进行分词,代码如下: 导入 nltk def segment_sentences(文本): # 如有必要,下载 Punkt 分词器 nltk.downl...
ent.sent.text in spacy 返回标签而不是 NER 问题的句子
我正在尝试使用 PDF 文件的 SpaCy 解决名称实体识别(NER)问题。我想从 pdf 文件中获取情态动词(will、shall、should、must 等)。 我在 sp 中训练了数据...
导入“spacy”无法解决 Pylance(reportMissingImports)
我是python的新手,在构建良好的工作目录方面没有太多经验。但根据我过去通过 pip 使用已安装软件包的经验,我没有遇到任何问题。 我很...
我试图从文本中提取引文和引文属性(即说话者),但出现错误。这是设置: 导入文本 将熊猫导入为 pd 导入空间 数据 = [...
如何在维护构成每个句子的字符串的信息的同时对字符串列表进行句子标记?
我有如下字符串列表(从 pdf 上的 OCR 找到),对于列表中的每个字符串,我也有它们在 pdf 中的位置坐标 [“新加坡的大部分基础设施......
我有一个包含 100 多个句子的列表,我需要找到最接近用户提示的句子。 问题是我们正在处理非常精确、细微的提示,因为我们分析的是数字数据。 举个例子……
我想将 errant 与 spacy v3 一起使用...errant 不适用于 spacy v3
errant 想要 'en' 模块工作,即 errant.load('en') 并且在 spacy v3 中没有 'en' 模块 我试图将 spacy 降低到版本 2 然后仍然有同样的问题。
有GPE、ROOT、LOC等术语,但是它们在SpaCy文档中的什么地方定义的呢? ChatGPT 说: 在 SpaCy 中,GPE 代表“地缘政治实体”。它是一个命名实体标签...
为 Transformer 的 GPU 训练安装 Spacy
我还安装了 CudaToolkit 和 cuDNN。 我有以下 显卡: | NVIDIA-SMI 531.68 驱动程序版本:531.68 CUDA 版本:12.1 | |--------------------------------...
不确定为什么我使用 Spacy 添加 phone_number 实体的 Python 代码不起作用
模式与匹配器一起工作。但不是作为一个实体?这是我的代码: 导入空间 从 spacy.pipeline 导入 EntityRuler nlp = spacy.load("en_core_web_sm") 模式 = [ { ...
我对 spacy python 和训练 ml 模型完全陌生。所以我的问题是 我怎样才能让我的模型每次都运行并为该模型提供我的训练数据集并完全生成一个新的 m...
嗨,我收到了这个 TypeError: dataclass_transform() got an unexpected keyword argument 'field_specifiers?
文件 ~ naconda3\lib\site-packages\pydantic_init_.py:2, 在初始化 pydantic.init() 文件 ~ naconda3\lib\site-packages\pydantic\dataclasses.py:48,在 init pydantic.dataclasses() 文件 ~ naconda3\lib\site-
尝试处理 PDF 和 DOCX 文件时出现 Spacy 和 Srsly 错误”或“使用 Spacy 和 Srsly 处理文档时出现 ExtraData 错误
我正在尝试使用 Spacy 对文档进行分类,但在尝试读取我的文件时,我不断收到“ExtraData”错误。我正在使用 Python 3.9 和 Spacy 3.1.1。我怎样才能解决这个错误并成功......
我想在 python 中使用 NLP 查找所有指示时间的单词。在英语中也称为时序词。这包括“晚上”“早晨”“第一”“5点”等作品。我找不到...
我正在用 python 运行一个语言分析程序。我的本地主机上已经运行了以下代码: 从烧瓶导入烧瓶,请求,jsonify,render_template 导入 en_core_web_sm 来自...
我想在 python 中使用 NLP 查找所有指示时间的单词。在英语中也称为时序词。我无法找到一种方法来做到这一点,而不必列出电子中的每个时间顺序词......
我无法阅读 SpaCy 的文档(非 comp-sci/soft-eng 背景),并且互联网上没有足够的教程让我弄清楚如何使用 SpaCy。 我想要...
我正在尝试使用 spacy 从 csv 创建的熊猫数据框中删除停用词。 我的问题是我正在尝试解释可能包含单词和数字的单词。 我的问题: 如果一个女...
我用SpaCy解析了一些文本的依赖关系。在提取给定标记/跨度的子树时,如何施加与这些依赖关系相关的条件? 比如我...
为什么不直接将键的字典作为字符串并将它们的值作为它们的属性/特性呢?是时间复杂度优势,还是也有节省内存的优势? 我有一个