我正在用 python 构建人工智能模型。我的模型说我的训练准确度为 99.9%,测试准确度为 95%,但是当我通过输入数据对其进行测试时,我得到了错误的结果。我正在使用随机森林、多项式本机 Nayes、XGBoost 和决策树分类器。所有这些模型都会产生相同的结果。我正在使用包含大约 70,000 个项目的数据集来训练所有模型。
提前谢谢您。
除非结果计算方法或其他方面存在严重问题或错误,否则所有模型都不可能产生相同的、极差的结果。如果您分享一些代码片段或更多有助于理解问题的信息,那么解决这个问题会更容易。但你可以在这里尝试一些事情。即使您有多个模型,如果它们都显示相似的问题,则可能表明这些模型对于当前的问题来说过于复杂。简化模型或使用正则化技术可能有助于提高泛化能力。您还提到您正在使用随机森林和 XGBoost 等集成方法。虽然这些方法通常很稳健,但如果使用不当,它们仍然可能会出现过度拟合的情况。确保您正确设置集成参数并考虑特征重要性分析等技术。