我尝试从此article基于LeNet架构从头开始构建CNN
我实现了背景,现在尝试使用16批大小的SGD在MNIST数据集上进行训练。我想找到一种快速的方法来验证学习是否顺利并且没有错误。为此,我可以看到每100个批次的损失,但是笔记本电脑花费的时间太长,而且看不到总体动态(损失向下波动,但偶尔会回升,所以我不确定)。有人可以提出一种成熟的方法来发现CNN运作良好,而无需等待很多小时的培训吗?
MNIST由60k的28 * 28像素的数据集组成。训练批次大小为16的CNN时,每个时期将具有4000次向前通过。现在考虑到您正在使用的LeNet并不是一个很深的模型。我建议您执行以下操作:
训练速度还取决于您使用的机器学习框架,例如Tensorflow,Pytorch等。我希望这会有所帮助。