深度学习模型的训练精度很高,但在二进制文本分类中的测试数据上表现不佳

问题描述 投票:0回答:1

我在处理二进制文本分类任务时遇到了一个令人困惑的问题。尽管尝试了多种深度学习模型,包括各种架构和超参数,但我始终观察到很高的训练准确率,通常在 97% 到 99% 之间。然而,当我根据看不见的测试数据评估这些模型时,它们的性能显着恶化。

为了解决这个问题,我决定探索机器学习模型作为替代方法。令人惊讶的是,随机森林等模型的性能与深度学习模型相当甚至更好,训练和测试数据的准确率均达到 97% 左右。随后,我尝试了其他几种机器学习算法,逻辑回归成为最适合我的特定用例的选择。

尽管有这些发现,我仍然感到困惑,为什么深度学习模型尽管表现出令人印象深刻的训练准确性,却无法很好地泛化到未见过的数据。有人可以阐明这种差异背后的潜在原因吗?是否存在我可能忽略的深度学习特有的常见陷阱或注意事项?任何见解或建议将不胜感激。

python tensorflow machine-learning keras deep-learning
1个回答
0
投票

您面临的问题可能是过度拟合。当算法与其训练数据过于接近甚至完全吻合时,就会发生过度拟合,从而导致模型无法从任何未见过的数据中做出准确的预测或结论,您可以在此处了解更多信息。

其他模型效果更好的原因可能是深度学习模型容易出现过拟合,尤其是当模型过于复杂或训练数据量不足时。随机森林及其集成方法本质上具有正则化效果,有助于防止过度拟合。

您的问题的可能解决方案可能是这样的:

  1. 收集更多数据:这有助于泛化
  2. 简化模型:您可以尝试减少层数或不太复杂的架构
  3. 正则化:有很多方法,例如权重或特征正则化

还有其他方法可以避免过度拟合,您可以搜索并查看哪一种最适合您的项目

© www.soinside.com 2019 - 2024. All rights reserved.