命名实体识别(NER)(也称为实体识别和实体提取)是信息提取的子任务,旨在将文本中的原子元素定位和分类为预定义的类别,例如人员,组织,地点,时间表达的名称,数量,货币价值,百分比等
我有以下一句话: text="英格兰的天气极其恶劣" 我想要执行自定义名称实体识别 (NER) 过程 首先,正常的 NER 程序将输出
我目前正在尝试对一组文档进行命名实体提取。我的计划是: 使用 pytesseract 进行 OCR 提取文本 申请法学硕士来获取患者姓名、年龄等实体。 一...
我有一个像这样的字符串: “日期为2019年6月30日至2022年1月1日(含)” 我想使用 spaCy 从此字符串中提取日期。 到目前为止,这是我的功能: 定义
我正在开发一个小型项目,将相似的句子聚集在一起。在实现这一目标之前,我必须对极其脏的数据进行预处理(这些数据都是用户输入的,免费...
我使用这个官方示例代码使用我自己的训练样本从头开始训练 NER 模型。 当我在新文本上使用此模型进行预测时,我想获得每个
重新导入 进口泡菜 导入keras 将张量流导入为 tf 从 keras.models 导入顺序 从 keras.layers 导入 TFSMLayer 将 numpy 导入为 np 类 CustomNonPaddingTokenLoss(keras.losses....
我正在尝试使用 spacy 和 python 创建一个从文本中提取实体的 NLP 项目。 我需要一些自定义实体,因此我创建了一个带有注释文章的 JSON 文件,我用它来训练我的...
我正在尝试使用Python对搜索引擎查询进行命名实体识别。 搜索引擎查询的一个重要问题是它们通常不完整或全部小写。 为了这个任务,我...
我正在尝试定义一个正则表达式,用作我的 spaCy 模型中实体标尺组件中的文本模式。 目的是每当发现单词结构时添加带有“COMP”标签的标记...
AttributeError:“TokenClassifierOutput”对象没有属性“detach”
您能帮我解决以下错误吗:'TokenClassifierOutput'对象没有属性'detach'即使修改了像output = model(input_ids,
我现在正在使用NER进行信息提取。我的数据集领域(主要)是计算机科学。它包含标签/标记:“TUJUAN”、“METODE”和“TEMUAN”。问题是
给定列大约有 13000 个值。下面的函数的工作方式是,输入是字符串列表,并对列表中的每个单词进行 NER 标记。平均有
任何人都可以帮我理解为什么 Spacy NER 拒绝识别句子中的最后一个名字“Hagrid”,无论使用什么模型(sm、md、lg)?: “赫敏买了一辆车,然后赫敏都……
在函数注册表“architectures”中找不到函数“spacy-transformers.TransformerModel.v3”
我试图创建一个自定义 NER 模型。我使用 spacy 库来创建模型。这行代码是从base.config文件创建配置文件。 我的代码是: !python -m spacy ...
我正在使用基于卡门贝尔的模型和Pytorch进行NER任务进行微调,获得的模型目前没有给出好的结果,但至少给出了一些句子的标签
NLP、NER --> python 提取个人信息(如名字、姓氏、财务代码)
我正在开发一个从自定义文档中提取个人信息的项目。特别是,我有一个 txt 文件,其中包含很多姓名和信息,但我想提取姓名和
我的 IndoBERT 模型出现 ValueError:该模型没有从输入中返回损失,仅返回以下键:last_hidden_state
我试图用我的数据集微调我的 IndoBERT 模型。当我使用 BERT base-uncased 时,它起作用了。但当我要用 IndoBERT 来做这件事时,它又回来了 -------------------------------------------...
我正在尝试训练 spacy3 NER 模型。我的机器上有可用的 GPU,规格如下: +------------------------------------------------ ----------------------------+ | NVIDIA-SMI 515.86...
将 json 文件格式更改为 .spacy 以进行自定义 NER 标记
我想为我的项目创建一个自定义标签。为了获得有关此主题的帮助,我浏览了本教程的使用 spaCy 3.0 构建自定义 NER 模型。 JSON 文件的包含内容 [{“文本”:&q...
我想编写一个 Spacy 模式来匹配作者姓名。例如,“史密斯、约翰、琼斯、鲍勃”。但逗号可以是分号。我想我想要的模式是: 作者模式 = [ {“