我有一个多类句子分类问题,我想在预测中实现某种未知类。有n个不同的标签,有时句子不得分类或分类为“未知\无”。
如果您有一些选择可以实现这种行为,我将非常高兴
分类器只能预测其在训练数据中看到的内容。如果您在训练数据中没有“未知”信息,那么您也永远不会在测试时看到。更糟糕的是,当做出错误的预测时,神经网络往往会非常有信心。
如果您的训练数据中包含属于未知类的实例,则将其用作其他任何类。如果不这样做,则可以查看estimating classifier confidence。