如本题所述(Scispacy for biomedical named entitiy recognition(NER)),模型的“ner”组件将它们标记为“ENTITY”。我们如何识别专门定制的术语?例如,将
["Banana" --> ENTITY]
更改为 ["Banana" --> "Food"]
。 Spacy“EntityLinker”(https://github.com/egerber/spaCy-entity-linker)不支持这种格式。需要进行哪些修改?
我只需要使用这个模型,因为它可以提取大部分实体。我只寻求有关如何将标签
"ENTITY"
更改为“食物”的帮助。带有代码的示例将非常有帮助。
#期望输出:
nlp = spacy.load("en_core_sci_lg")
doc = nlp("I ate Apple and Banana")
for en in doc.ents:
print(f"{en.text} ---->{en.label_}")
苹果 ---> 食物
香蕉--->食物