我有一个文本可以包含多个命名实体(例如,一个人和两个组织)。我需要根据Named-Entity-Tagger的置信度选择其中一个文本。 (最后的例子)
该项目使用“analyzeEntities”details here来标记命名实体。如何获得每个标记实体的置信度?
示例:让文本为“Homes和Joshua是StackOverflow的两名员工”。
让我们假设标记符具有以下置信度:
Homes -> PERSON -> 0.3
Joshua -> PERSON -> 0.7
StackOverflow -> ORGANIZATION -> 0.4
我需要选择“Joshua”,因为这个实体的置信度得分最高。一种方法是从服务API获取置信度分数以及返回的内容。我怎样才能做到这一点?有没有办法得到像上面这样的分数?
PS:我使用Python 3.x,但也欢迎使用其他语言的解决方案。
目前,API不公开实体预测的任何置信度数字。它产生一个“显着性”分数,它将得分与每个实体相关联,以表明它们在文本中的重要性,而不是与表示模型对其预测有多信心的置信度相混淆。