有没有一种方法可以提取法语中的引语及其相关发言人?

问题描述 投票:0回答:1

有没有一种方法可以通过 coreferecne 的管理来提取报价及其相关发言人

我想在输出中得到一个带有 [{"speaker" : , "quotes": }] 的 dic,如果我们找不到发言者,我们将 None 放入发言者并添加“潜在发言者”:共同引用

nlp stanford-nlp spacy-3
1个回答
0
投票

如果您想识别引言和说这句话的人,您可以使用经过数据库训练的模型,该数据库包含引言及其各自的说话者。 Citron - https://github.com/bbc/citron 就是这样一种工具,您可以使用它来标记引号。因为模型已经过训练,所以您和其他用户都可以使用。

我不确定您的文档属于哪个领域 - 医疗、IT 还是其他领域?因此,我的建议是微调 Citron 等库提供的预训练模型,使它们更适合您的领域。

© www.soinside.com 2019 - 2024. All rights reserved.