说我们有一个单通道图像(5x5)
A = [ 1 2 3 4 5
6 7 8 9 2
1 4 5 6 3
4 5 6 7 4
3 4 5 6 2 ]
和过滤器K(2x2)
K = [ 1 1
1 1 ]
应用卷积的示例(让我们从A中获取第一个2x2)是
1*1 + 2*1 + 6*1 + 7*1 = 16
这非常简单。但是让我们为矩阵A(即具有3个通道甚至在深层网络中具有转换层的RGB图像(深度可能为512))引入一个深度因子。使用相同的滤波器如何进行卷积运算? 类似的练习对于RGB情况真的很有帮助。
它们将与您对单个通道图像的处理方式相同,只是您将获得三个矩阵而不是一个。This是有关CNN基础知识的讲义,我认为这可能对您有所帮助。
对于类似RGB的输入,滤镜实际上是2 * 2 * 3,每个滤镜对应一个颜色通道,从而产生三个滤镜响应。这三个因偏见和激活而加在一起。最后,这是输出映射中的一个像素。