使用“en_core_sci_lg”命名实体识别(NER)

问题描述 投票:0回答:0

如本题所述(Scispacy for biomedical named entitiy recognition(NER)),模型的“ner”组件将它们标记为“ENTITY”。我们如何识别专门定制的术语?例如,将

["Banana" --> ENTITY]
更改为
["Banana" --> "Food"]
。 Spacy“EntityLinker”(https://github.com/egerber/spaCy-entity-linker)不支持这种格式。需要进行哪些修改?

我只需要使用这个模型,因为它可以提取大部分实体。我只寻求有关如何将标签

"ENTITY"
更改为“食物”的帮助。带有代码的示例将非常有帮助。

#期望输出:

nlp = spacy.load("en_core_sci_lg")

doc = nlp("I ate Apple and Banana")

 for en in doc.ents:

print(f"{en.text} ---->{en.label_}")

苹果 ---> 食物

香蕉--->食物

python-3.x nlp spacy named-entity-recognition spacy-3
© www.soinside.com 2019 - 2024. All rights reserved.