spaCy只能链接命名的实体吗?

问题描述 投票:0回答:1

这里摘自(据说)一家餐馆的有趣评论:

我想亲自握手豆腐先生的手。虽然我不能医学上证明它,但我100%确信它们的dundubu包含未定义的healing属性。从某种意义上来说,我在这里用餐后总是感觉好些。有cold吗?拧Nyquil并加入辛辣的[[kimchi

我想提取重要实体并将其链接到Wikipedia实体。我已经对一小部分Wikipedia / WikiData进行了spaCy培训,并在评论中运行了实体链接:

[('Tofu', 'PERSON', 'Q177378'), ('Nyquil', 'WORK_OF_ART', 'NIL')]

我也希望提取和链接其他实体,例如:

kimchi -> Kimchi cold -> Common cold healing -> medicine medically -> medicine

看来spaCy只能链接命名实体。我试图将其他实体明确列出为具名(显然不能很好地扩展):

ruler = EntityRuler(nlp) patterns = [{"label": "ORG", "pattern": "kimchi"}, {"label": "ORG", "pattern": "cold"}] ruler.add_patterns(patterns) nlp.add_pipe(ruler)

但是,spaCy似乎根本不链接新实体:

[ ('Tofu', 'PERSON', 'Q177378'), ('cold', 'ORG', ''), ('Nyquil', 'WORK_OF_ART', 'NIL'), ('kimchi', 'ORG', '')]

    我如何使Spacy也识别其他实体?
  • 应该在训练实体链接模型之前完成还是应该在已经训练的模型上完成?
  • spaCy完全适合我的任务吗?
  • [摘录自某餐厅的(据说)有趣的评论:我想亲自与豆腐先生握手。虽然我无法从医学上证明它,但我100%确信他们的dundubu包含...
  • python spacy wikipedia wikidata entity-linking
    1个回答
    1
    投票
    理论上是可能的。首先,您需要确保您有一个标记此类实体的组件。您可以为此设置train an NER model,但是要知道,在“冷”之类的情况下,它的性能可能不如在“伦敦”之类的实际命名实体上那样。
    © www.soinside.com 2019 - 2024. All rights reserved.