我目前正在与SpaCy NER一起玩,想知道SpaCy NER是否可以完成以下两件事:
案例1
假设我们要使用NER做2个句子:
我们可以在第一句中将“增加”标记为“症状”实体,而在第二句中将“增加”标记为“好结果”实体吗? NER会看到这2个“增加”字词之间的区别吗?
案例2
我们也有2个不同的句子:
NER可以将第一句话中的数字视为“收入”实体,将第二句话中的数字视为“支出”吗?
谢谢
这些任务超出了您期望NER模型能够以多种方式完成的任务。 Spacy的NER算法可用于查找实体类型,例如MONEY
(在其英语模型中为实体类型)或类似SYMPTOM
的事物,但它并不会考虑很大的上下文来检测/分类实体,因此无法区分相关上下文相距较远的这些情况。
您可能希望将NER(或其他类型的相关范围检测,也可以基于规则)与另一种类型的分析结合起来,而这种分析更多地关注于上下文。这可能是某种文本分类,您可以检查依赖项解析等。
这是spacy文档中的一个简单示例,其中涉及使用NER提取实体关系(以查找MONEY
),然后检查依赖项解析以试图弄清楚money元素可能是指什么: