Doccano 是用于机器学习的数据注释工具。 它的创建者还开发了 doccano-transformer,用于将 doccano 提供的 JSONL 输出格式转换为 spacy 格式。
这里是 Github https://github.com/doccano/doccano-transformer
代码:
dataset.to_spacy(tokenizer=str.split)
给了我一个“生成器”对象,我不知道如何处理它。它肯定不是预期的“spacy”对象。所以我想知道是否有人知道如何将此生成器转换为 spacy ?