是否可以为coreNLP提供一组命名实体以及一组句子以进行共指消解

问题描述 投票:0回答:1

我正在尝试对数据集进行共同参考解析,但斯坦福大学的命名实体识别器无法在我的文本集中正确地对命名实体进行分类。因此,有可能给斯坦福共同参考模块提供一组命名实体和来自不同NER的文本,例如我的研究中的NLTK,到目前为止看起来你不能在管道核心时拆分管道?理想情况下,我可以使用stanfords NER,然后使用我的命名实体从另一个NER更新它,然后再将它传递给coref模块。任何帮助将不胜感激。

我目前正在使用Python进行所有操作,因此我已经测试了stanfordcoreNLP的各种Python包装器,所有这些包装器似乎只有catch的所有选项才能完成coref,从而无法实现我所需要的。我还查看了coreNLP文档,无法找到一个明确的答案,即使在Java或使用服务器,这是否可行。

nlp nltk stanford-nlp ner
1个回答
0
投票

我使用了Stanford CoreNLP的“命名实体识别”(ner)注释器中的附加TokensRegexNER规则文件。基本上,您使用一组命名实体构造制表符分隔文件。

https://stanfordnlp.github.io/CoreNLP/ner.html#additional-tokensregexner-rules

我无法在nltk中执行此操作,但我使用nltk的相同Stanford CoreNLP java管道将规则文件传递到CoreNLP jar(通过-ner.additional.regexner.mapping选项)。我在答案中深入探讨了一下:How to feed CoreNLP some pre-labeled Named Entities?。我想可以直接将对象构建为支持此功能的nltk,因为nltk中的大多数CoreNLP处理都是作为派生对象实现的,只需使用一组CoreNLP选项开关构造。

© www.soinside.com 2019 - 2024. All rights reserved.