named-entity-recognition 相关问题

命名实体识别(NER)(也称为实体识别和实体提取)是信息提取的子任务,旨在将文本中的原子元素定位和分类为预定义的类别,例如人员,组织,地点,时间表达的名称,数量,货币价值,百分比等

如何修改或重新训练现有的OpenNLP模型?

有什么方法可以重新训练现有的 OpenNLP 模型吗?即从 OpenNLP 向现有模型添加新项目? 假设我想向现有的 en-ner-date.bin 添加一些新条目,因为有些...

回答 1 投票 0

Spacy v3 DocBin 无法保存 train.spacy 字节对象太大

我想在 spacy v3.0+ 中训练大数据 有 8000000 个数据令牌计数 我每个块做了 1000000 个,最后 murge vai DocBin python 代码但出现错误 导入操作系统 导入spacy 来自太空。

回答 1 投票 0

无法从 Python 脚本创建和运行 Azure ML Text NER 作业

我正在尝试从 Python 脚本触发 Azure ML 服务上的文本 NER 作业,并将训练和验证文件夹从本地路径上传到数据存储上。代码如下: 导入操作系统 来自

回答 1 投票 0

如何应用huggingface中的预训练变压器模型?

我有兴趣使用 Hugging Face 的预训练模型来执行命名实体识别 (NER) 任务,而无需进一步训练或测试模型。 Hugging Face的模特页面上,唯一

回答 2 投票 0

如何让spaCy大小写不敏感

如何在查找实体名称时使 spaCy 不区分大小写? 是否有任何我应该添加的代码片段或其他内容,因为问题可能会提到非大写的实体...

回答 2 投票 0

用于 ML 预测的 NER(命名实体识别)的 CUDA 问题

我正在尝试使用 NamedEntityRecognition (NER)(https://github.com/dotnet/machinelearning/issues/630) 来预测大量文本中单词/短语的类别。 目前使用 3 Nuget

回答 1 投票 0

为 BERT-NER 标记 100k 数据集

我如何有效地标记数据集直到 100k++?我将其用于 BERT-NER?如果有方法,您能给我类似代码/教程/源代码来实现吗?谢谢!顺便说一句,我将用于我的 B 的数据集...

回答 1 投票 0

如何使用spaCy和Python提取“b-per”、“b-misc”等类型的命名实体识别标签?

我能找到的文档建议在 spaCy 文档中使用 span 的“labels_”属性。然而对我来说,这返回 POS 标签而不是 NER 标签。我需要有类型来指示是否...

回答 1 投票 0

如何下载和导入(最好使用spacy和hugginface)最新训练有素的biobert官方版本来对医学文本执行ner

张等人。 2020年的研究比较了biobert和scispacy ner模型的准确性,总体来说biobert获胜。如何下载和导入(最好使用 spacy 和从 Huggin Face)最新的 **训练过的 **

回答 1 投票 0

spaCy 中的 LLM 模型需要 OpenAI 密钥

#有代码: 导入spacy nlp = spacy.blank("en") #下一行抛出下面的错误 llm_ner = nlp.add_pipe("llm_ner") C:\Program Files\Python311\Lib\site-packages\spacy_...

回答 1 投票 0

从表单中的图像中提取信息

我有一些表格,填写了姓名:某事姓氏:某事等等。所有页面的格式都相似。 我有这种形式的图像。首先我通过 tesseract(pyt...

回答 1 投票 0

查找近似字符串匹配并替换为预定义字符串的有效方法

我需要构建一个NER系统(命名实体识别)。为简单起见,我通过使用近似字符串匹配来完成此操作,因为输入可能包含拼写错误和其他细微修改。我来了...

回答 1 投票 0

在 Spacy 中使用 NER 恢复解析器:训练数据具有重叠的实体开始和结束索引。有解决办法吗?

示例: 格式:{内容,注释:{标签:“”点[起始索引,最后索引,文本:“”]}} 假设我们有:内容中的文本是:“浦那大学”,我想要...

回答 1 投票 0

共指、语义图和 NERC 的 Python API 使用

简介 你好,我已经使用 freeling 来提取三胞胎几个月了。到目前为止,我已经通过使用依赖树和完整的解析树成功地做到了这一点,但我正在尝试添加 NERC。 我的

回答 1 投票 0

使用 Python spaCy 进行命名实体识别

我想使用Python spaCy 包编写一个命名实体识别系统。但是,我无法在 spaCy 包中安装本地语言。有谁可以告诉我如何安装或

回答 1 投票 0

如何提高天赋NER模型结果?

我对 NER 和 NLP 总体来说是新手,我想知道我是否正确理解了这些材料。 例如,我有预训练的模型“ner-english-large”。 我正在使用一个模型,结果...

回答 1 投票 0

如何在 Python 中对元组进行频率计数

所以我有一个df 一个标题 克鲁 [('18', 'nummod'), ('年份', 'nsubj'), ('of', '准备'), ('年龄', 'pobj'), ('或', 'cc') , ('老年', 'conj'), ('with', 'prep'), ('可切除', 'amod'), ('胰腺', 'amod...

回答 1 投票 0

属性错误:“str”对象没有属性“is_context_set”

我正在尝试实现天赋来获取一段文本的ner标签(在colab中执行此操作)。尝试 tagger.predict(text) 时遇到此错误。我应该怎么做才能解决这个问题? 这是我的c...

回答 1 投票 0

Excel Python 比较

我是Python新手并且遇到了这个问题 所以我想比较 rosyi 和 azmi 列,如果该列有“_”,结果将是“其他”,如果该列有“...

回答 1 投票 0

地理标记或地理标签文本内容的方法

有哪些好的算法可以自动用城市/地区或原产地标记文本?也就是说,如果一个博客是关于纽约的,我如何以编程方式判断。有包裹/文件吗...

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.