如何在具有三个（RGB）通道的图像上计算卷积？

Question

说我们有一个单通道图像（5x5）

A = [ 1 2 3 4 5
      6 7 8 9 2
      1 4 5 6 3
      4 5 6 7 4
      3 4 5 6 2 ]

和过滤器K（2x2）

K = [ 1 1
      1 1 ]

应用卷积的示例（让我们从A中获取第一个2x2）是

1*1 + 2*1 + 6*1 + 7*1 = 16

这非常简单。但是让我们为矩阵A（即具有3个通道甚至在深层网络中具有转换层的RGB图像（深度可能为512））引入一个深度因子。使用相同的滤波器如何进行卷积运算？ 类似的练习对于RGB情况真的很有帮助。

Answer 1

它们将与您对单个通道图像的处理方式相同，只是您将获得三个矩阵而不是一个。This是有关CNN基础知识的讲义，我认为这可能对您有所帮助。

Answer 2

假设我们有一些矩阵A给出的3通道（RGB）图像

A = [[[198 218 227][196216225][196214224]......[185201217][176192208][162178194]

和模糊内核为>

K = [[0.1111，0.1111，0.1111]，[0.1111、0.1111、0.1111]，[0.1111、0.1111、0.1111]＃实际上是0.111〜= 1/9卷积可以表示为下图所示

如您在图像中所看到的，每个通道分别进行卷积，然后合并形成一个像素。

Answer 3

对于类似RGB的输入，滤镜实际上是2 * 2 * 3，每个滤镜对应一个颜色通道，从而产生三个滤镜响应。这三个因偏见和激活而加在一起。最后，这是输出映射中的一个像素。