我正在为三个标签(PER,ORG,LOC)做NER分类器。我正在根据stanford crf分类器检查我的结果。因此,我想知道stanford crf分类器评估部分是如何工作的。它是否考虑了所有TAGS(PER,ORG,LOC,O)或仅考虑(PER,ORG,LOC)?
根据提取实体的召回和精确度,得分为F1。如果您有标记方案,例如(PER,ORG,LOC),则实体只是具有相同标记的连续标记序列。请注意,带有O
标签的令牌序列不被视为实体。
最终报告为所有实体提供F1,并为每个实体类型提供F1分数。
另请注意,没有部分功劳。您要么正确找到实体,要么找不到。因此,在“Joe Smith生活在加利福尼亚州”的例句中,“Joe”和“Smith”都必须被标记为PERSON
才能获得正确找到的PERSON
实体。如果只是“Joe”被标记为PERSON
(并且“Smith”被标记为O
),您将得到0分正确的PERSON
实体和1个不正确的PERSON
实体。