使用Stanford NER在多个文件上标记NE

问题描述 投票:1回答:1

我想使用斯坦福大学NER标记多个文件中的名称实体。在文档中,据说我们可以使用选项-testFiles以及用逗号分隔的测试文件列表,但是在我的情况下它不起作用,例如:

java -cp stanford-ner.jar edu.stanford.nlp.ie.crf.CRFClassifier
     -loadClassifier ner-model.ser.gz -testFiles Test_file1.tsv,Test_file2.tsv

但是当我们仅输入一个文件时,它可以工作。

系统是否对所有多个文件都有内联评估(FOR P,R)?我只是想知道它在多个文件的情况下如何工作。

提前感谢。

哈达卡

named-entity-recognition
1个回答
1
投票

您必须使用prop.txt文件才能使用多个tsv文件。检查此链接

https://nlp.stanford.edu/software/crf-faq.html#mfiles

下面是NER FAQ页面中的摘录

如何从多个文件中训练一个模型?

而不是设置trainFile属性或标志,而是设置trainFileList属性或标志。使用逗号分隔的文件列表。

© www.soinside.com 2019 - 2024. All rights reserved.