如何将bert + crf知识提取到较小的网络中进行序列标记

问题描述 投票:2回答:1

我正在使用BERT-BILSTM-CRF模型进行序列标记。我现在想要的是将重型模型提炼成更小的模型,例如lstm-crf。在调查了相关论文之后,我发现几乎所有解决方案都基于softmax输出而不是crf输出。是否有用于crf输出蒸馏的解决方案?

deep-learning lstm crf
1个回答
0
投票

您可以检查此-(这在pytorch中)https://github.com/jind11/HSLN-Joint-Sentence-Classification

© www.soinside.com 2019 - 2024. All rights reserved.