对不起,我问这个愚蠢的问题,但经过一番思考,我仍然不明白:
根据乔迪·托雷斯(Jordi Torres,请参阅here),如果我们看一幅28x28 = 784像素的图像,那么一种实现方法是让隐藏层的一个神经元了解输入层的5x5 = 25像素:
但是,正如他解释的那样:
[稍微分析一下我们提出的具体情况,我们注意到,如果我们有一个28×28像素的输入和一个5×5的窗口,这将在第一个隐藏层中定义24×24个神经元的空间,因为我们只能在碰到输入图像的右侧(或底部)边界之前,将窗口向右移动23个神经元,向底部移动23个神经元。我们想向读者指出,我们所做的假设是,当新行开始时,窗口在水平和垂直方向上都向前移动了1个像素。因此,在每个步骤中,新窗口都与前一个窗口重叠,除了我们已经前进的这一行像素。]
我真的不明白为什么我们在第一个隐藏层中需要24x24神经元的空间?因为我采用5x5的窗口(其中784个窗口中有25个像素),所以我认为我们完全需要785/25 = 32个神经元。我的意思是,隐藏层的一个神经元是否不学习25像素的属性?显然不是,但是我真的很困惑。
对不起,我问了这个愚蠢的问题,但经过一番思考,我仍然不明白:根据乔迪·托雷斯(Jordi Torres)(请参阅此处),如果我们查看28x28 = 784像素的图像,到...
您假设非重叠