这里摘自(据说)一家餐馆的有趣评论:
我想亲自握手豆腐先生的手。虽然我不能医学上证明它,但我100%确信它们的dundubu包含未定义的healing属性。从某种意义上来说,我在这里用餐后总是感觉好些。有cold吗?拧Nyquil并加入辛辣的[[kimchi
我想提取重要实体并将其链接到Wikipedia实体。我已经对一小部分Wikipedia / WikiData进行了spaCy培训,并在评论中运行了实体链接:
[('Tofu', 'PERSON', 'Q177378'),
('Nyquil', 'WORK_OF_ART', 'NIL')]
我也希望提取和链接其他实体,例如:
kimchi -> Kimchi
cold -> Common cold
healing -> medicine
medically -> medicine
看来spaCy只能链接命名实体。我试图将其他实体明确列出为具名(显然不能很好地扩展):
ruler = EntityRuler(nlp)
patterns = [{"label": "ORG", "pattern": "kimchi"}, {"label": "ORG", "pattern": "cold"}]
ruler.add_patterns(patterns)
nlp.add_pipe(ruler)
但是,spaCy似乎根本不链接新实体:
[ ('Tofu', 'PERSON', 'Q177378'),
('cold', 'ORG', ''),
('Nyquil', 'WORK_OF_ART', 'NIL'),
('kimchi', 'ORG', '')]
我如何使Spacy也识别其他实体?