如何使用 doccano-transformer 发电机输出?

问题描述 投票:0回答:0

Doccano 是用于机器学习的数据注释工具。 它的创建者还开发了 doccano-transformer,用于将 doccano 提供的 JSONL 输出格式转换为 spacy 格式。

这里是 Github https://github.com/doccano/doccano-transformer

代码:

dataset.to_spacy(tokenizer=str.split)

给了我一个“生成器”对象,我不知道如何处理它。它肯定不是预期的“spacy”对象。所以我想知道是否有人知道如何将此生成器转换为 spacy ?

python annotations spacy named-entity-recognition doccano
© www.soinside.com 2019 - 2024. All rights reserved.