命名实体识别(NER)(也称为实体识别和实体提取)是信息提取的子任务,旨在将文本中的原子元素定位和分类为预定义的类别,例如人员,组织,地点,时间表达的名称,数量,货币价值,百分比等
我从互联网上复制并组合了这段代码,我需要知道如何训练它以及如何一次提取一行的 NER
我不断收到错误。我试图改变事情,但它变得更糟而不是更好。我是新来的。我想让它接受训练——“trained_perceptron”——并需要它来处理一个句子……
“RobertaTokenizerFast”对象在将数据加载到自定义 NER 模型时没有属性“_in_target_context_manager”错误
我正在尝试使用 spacy 将数据加载到自定义 NER 模型中,但出现错误:- 'RobertaTokenizerFast' 对象没有属性 '_in_target_context_manager' 然而,它与其他
How to convert text JSON: a way to standardize outputs with Hugging Face and Pytorch
拥抱脸和人工智能的新手。 我的目标是将输入文本转换为标准化结构,以便稍后能够处理 JSON 格式的表格数据。 例如, 输入:“
给定一个文本,我希望找到与文本中提到的命名实体相关的所有维基百科页面的链接。有没有一种可靠的方法可以做到这一点?例如,考虑文本,Mark Elliot ...
我发现spaCy的相似性在使用 "en_core_web_lg "开箱即用的情况下对我的文档进行比较时做得很好。我想收紧一些领域的关系,并认为添加自定义 ...
我正在研究简历数据集上的命名实体识别,我们有像日期,电话,电子邮件等实体,我正在研究如何预处理这些实体。我目前正在对这些实体进行预处理。
是否存在经过培训的生物医学名称实体识别框架?谢谢和亲切的问候。
我有几个包含有关公司的数据的数据集:-实体结构(列:entity_id,parent_entity_id,ultimate_parent_id)-实体地址(列:address_id,entity_id,...
我曾尝试使用基于“卡门贝特”模型的法语将变压器用于NER。我从以下网址找到了此代码:https://huggingface.co/transformers/usage.html。不幸的是,...
我曾尝试使用基于“卡门贝特”模型的法语将变压器用于NER。我从以下网址找到了此代码:https://huggingface.co/transformers/usage.html。不幸的是,...
我对ML和Spacy还是陌生的。我正在尝试从输入文本中显示命名实体。这是我的方法:def run():nlp = spacy.load('en_core_web_sm')句子=“嗨,我的名字...
我有一个像这样的ENAMEX格式的数据集: 意大利 的商业世界被公告[[上星期四
将BIO令牌组合成复合词的任何方法。我实现了从BIO模式中形成单词的方法,但是这种方法不适用于标点符号的单词。例如:使用以下内容的S.E.C ...
我正在尝试使用python创建聊天机器人,为此我正在使用Spacy进行实体识别,因此我已经安装了预构建的Spacy英语模型(中)以从用户中提取实体...
我想将我的熊猫数据框转换成可以在NER模型中使用的格式。我有一个这样的熊猫数据框:```Sentence_id Sentence ...
我使用https://spacy.io/usage/training#example-new-entity-type在en_core_web_lg中添加了一个名为“ orgName”的新实体,我所有的训练数据(26k句子)中都标有“ orgName”。处理...
为西班牙语中的StanfordNLP配置SUTime-Java
我无法在stanford-spanish-corenlp-2018-10-05-models.jar随附的西班牙语版本中设置SUTime,但在Stanford文档中却说ner ...选项。]] >
[使用Spacy,我根据我定义的语法规则从文本中提取了方面-观点对。规则基于POS标记和依赖标记,这些标记是通过token.pos_和token.dep_获得的。 ...
我是NLP的新手。我想使用命名实体识别算法从文本中提取名称和位置,而不使用任何库。示例:美国航空表示将启动...
我正在将NLP与python配合使用,以从字符串中查找名称。如果我有全名(名字和姓氏),但在字符串中我只有名字,则我无法找到我的代码...