Spacy 2.0 NER培训

问题描述 投票:3回答:2

在SpacyV1中,可以通过提供BILOU格式的文档和实体注释列表来训练NER模型。

然而,似乎在V2训练中只能通过提供像这样的实体注释(7,13,'LOC'),所以使用enity偏移和实体标签。

提供令牌列表和BILOU格式的另一个实体标签列表的旧方法仍然有效吗?

从我从文档中收集的内容看起来nlp.update方法接受GoldParse对象列表,因此我可以为每个doc创建一个GoldParse对象,并将BILOU标记传递给它的entities属性。但是,如果忽略GoldParse类的其他属性(例如磁头或标签https://spacy.io/api/goldparse)或者培训NER不需要的其他属性,我会丢失重要信息吗?

谢谢!

nlp training-data named-entity-recognition spacy
2个回答
3
投票

是的,您仍然可以使用BILUO标记创建GoldParse对象。使用示例显示“更简单”的偏移格式的主要原因是它使它们更容易阅读和理解。

如果您只想训练NER,您现在也可以在训练期间使用nlp.disable_pipes() context manager并禁用所有其他管道组件(例如'tagger''parser')。在块之后,组件将被恢复,因此当您保存模型时,它将包括整个管道。你可以在NER training examples中看到这个。


-1
投票

如何使用GoldParse对象进行训练?我已经尝试了一段时间,我无法弄明白。

© www.soinside.com 2019 - 2024. All rights reserved.