我正在研究用于图像分类的多层感知器。我陷入了过度拟合的境地,每次使用k倍交叉验证运行模型时,都会得到不同的结果,有时是90%,有时是99%,有时是88%。现在我要做的是,有人告诉我对它执行T检验,以便可以验证我们的结果,但我不知道如何对k折执行该操作。
[请建议我提供更好的解决方案,要么我应该进行T检验,要么其他?
实际上,模型的性能是所有“测试”批次中随时间推移的准确性的平均值。
Here,您可以阅读更多有关它的信息。