named-entity-recognition 相关问题

命名实体识别(NER)(也称为实体识别和实体提取)是信息提取的子任务,旨在将文本中的原子元素定位和分类为预定义的类别,例如人员,组织,地点,时间表达的名称,数量,货币价值,百分比等

如何将地名列表与 python 中的语料库匹配?

我有一个包含地名列表的文件,我想将其与研究摘要语料库中的研究地点进行匹配。地名列表存储在如下文件中 地名 特征 长...

回答 0 投票 0

尝试将地名词典中的地名/位置与语料库文件中的相应名称相匹配,但没有成功。有什么建议吗?

我有2个文件。一种是具有 4 列的地名词典文件,其中一列包含地名。另一列包含由地名表示的地形特征,而 ...

回答 0 投票 0

如何使用 doccano-transformer 发电机输出?

Doccano 是用于机器学习的数据注释工具。 它的创建者还开发了 doccano-transformer,用于转换 doccano gi 的 JSONL 输出格式...

回答 0 投票 0

NLP,NER 空列表作为输出,但情况并非如此

所以我正在 datacamp 上学习 NLP 课程。在控制台上运行以下代码时,它为我提供了正确的输出,但在我的本地计算机上运行时却没有 我试过跑步 创建默认字典:

回答 0 投票 0

使用 spaCy 3 为文本分类创建自定义 NER

我正在尝试通过在二进制文本分类(做运动,不做运动)的文本响应中查找运动术语来标记来创建自定义 NER。这是正确的做法吗...

回答 0 投票 0

文本中字典的命名实体识别

我需要从文本中提取关键词。我有一个关键字字典,比方说 阿帕奇火花 爪哇 路径 亚马逊网络服务 阿帕奇卡夫卡 我有一个工作岗位,例如: 设计、开发和制造……

回答 1 投票 0

使这个经过训练的命名实体代码一次使用一个句子

导入警告 warnings.simplefilter(action='ignore', category=FutureWarning) 将熊猫导入为 pd 将 numpy 导入为 np 导入编解码器 #f = codecs.open(dir+location, 'r', encoding='utf-8') #data = f....

回答 0 投票 0

如何在 Python 中从德语文本中提取日期和时间表达式?

我想从德语的非结构化书面文本中提取日期和其他时间表达式,包括格式如下 'Es ist der 1. Januar 2020.' “Gestern hat es geschneit。” '嘿...

回答 1 投票 0

训练自定义 Spacy NER 模型但无法进入训练循环

所以我正在尝试创建一个自定义 NER 模型,并按照以下步骤操作: 我得到了带有文本示例和标签以及开始和结束索引的培训日期。 现在我运行以下...

回答 0 投票 0

使用 SpaCy 的英语 Lang 人名检测。寻找答案

我正在使用 Spacy 并尝试检测文本中的名称。例如,text = 'Keras 是一个很好的包。亚当斯密使用黑色汽车。我希望卡特里娜飓风在她的工作中表现出色。 答案是...

回答 2 投票 0

为什么 GPT-J 的行为随着文本中的微小偏差而改变

我正在使用 GPT-J,无需微调即可从文本中执行实体提取。我已将我的实验限制在有限数量的实体(人、组织、地点、日期)以保持简单。 我尝试了各种

回答 0 投票 0

我很难让这段代码运行[关闭]

如何激活语料库训练? 我如何让它一次处理一个句子? 任何帮助,将不胜感激。它是用 python 2.7 编写的,我使用的是 3.7.8 这是一个组合...

回答 0 投票 0

Huggingface 标记分类管道提供不同的输出,而不是直接调用模型()

我正在尝试使用基于 roberta 的模型来掩盖文本中的命名实体。 使用该模型的建议方法是通过 Huggingface 管道,但我发现以这种方式使用它相当慢。使用

回答 1 投票 0

How to solve ValueError: expected sequence of length 15 at dim 1 (got 18) error in python

我正在使用拥抱面模型训练一个简单的自定义 NER 模型。我的输入长度不同,我通过截断和填充来解决。 我在 2 个 GPU 上训练这个。 我收到以下错误信息

回答 0 投票 0

在逗号分隔符处拆分句子,但保留值中存在的逗号

我遇到了一个问题,我需要拆分一个包含多个句子的句子,必须在逗号分隔符处拆分。面临的问题是,即使字符串也有逗号,应该...

回答 1 投票 0

如何规范化命名实体识别提取的关键字

我正在尝试使用 NER 从职位发布中提取关键字(标签)。这可以是 React、AWS、Team Building、Marketing 等任何东西。 在 SpaCy 中训练自定义模型后,我看到了...

回答 1 投票 0

用其他词拆分实体的命名实体识别

我有一份法律文件,我想在其中自动识别对另一份法律文件的引用。 这些文件的结构类似于这个虚拟示例: 第 85 条第 6 项

回答 1 投票 0

具有中等训练数据大小的简历解析最佳模型

目前我正在为突尼斯简历构建一个简历解析器,它将是英语和法语我开始研究我发现太多模型,现在我缩小了使用 SpaCy cust 的范围......

回答 0 投票 0

PyTorch,Bert 模型:优化器 zero_grad() error

我是 Python 的新手,我正在学习一个教程(https://towardsdatascience.com/named-entity-recognition-with-bert-in-pytorch-a454405e0b6a)关于 bert 训练我需要的任务...

回答 0 投票 0

无法在孟加拉语上为 Few Shot 或 Zero Shot NER 从头编写代码

我正在尝试编写 python 代码,通过孟加拉语语言的少镜头或零镜头学习来开发名称实体识别功能。我正在从头开始寻找 python 代码,它可以完成 fe...

回答 0 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.