远程监管:基于规则的标记方法?

问题描述 投票:1回答:1

我目前正在研究实体关系方面的东西,我发现许多论文都实施了远程监督来标记数据。我对远程监管的了解是,我们已经建立了知识库(KB),并且通过检查提取的实体对是否存在于知识库中来进行某种“基于规则的标记”。如果实体对以KB存在,则将其标记为正,否则将标记为负。

我的问题是:

  1. 我是否正确理解了这个远程监管概念?
  2. [如果是,我不明白为什么我们要训练神经网络对基于规则的系统进行分类?例如,如果将来我们得到包含实体的新句子,并且想检查它们之间是否有关联,为什么我们不只是参考知识库?为什么我们要训练实体关系呢?

谢谢

machine-learning nlp data-science named-entity-recognition
1个回答
0
投票

远程监督是使用基于规则的启发式方法来生成标记数据的方法,然后将所生成的标记数据用于训练模型(通常是神经网络)。

知识库(KB)可以用作基于规则的启发式方法。如Nathan McCoy所述,知识库通常不会完整,并且该模型使您能够检测到知识库中不存在的实体之间的关系。

Snorkel是为远程监视而开发的工具的示例

© www.soinside.com 2019 - 2024. All rights reserved.