嗨,我看到许多均方误差(MSE)图,如下所示:
我对生成蓝线(训练)的理解如下: 通过一定的优化算法来优化权重和偏差值。对于每个时期,计算 MSE。
但是,我不明白如何生成绿线和红线。
您了解验证和测试数据的目的吗?
假设您正在使用 100,000 条数据训练神经网络。你应该将它们随机分成。训练(60,000)、验证(20,000)和测试(20,000)。
训练数据是网络实际训练出来的数据,验证数据是在每个时期检查的数据:这样做是为了防止训练数据过度拟合,并优化超参数。
最后,您可以根据测试数据来测试网络,这是针对过度拟合的另一种测试。