这是3D CNN中一层的代码,我的输入是视频帧。我很难理解参数的含义。
net = slim.conv3d(net, 64, [1, 3, 3], scope='conv32')
net = PReLU(net, 'conv32_activation')
net = tf.nn.max_pool3d(net, strides=[1, 1, 2, 2, 1], ksize=[1, 1, 3, 3, 1], padding='VALID', name='pool3')
[1,3,3]是指我的过滤器尺寸吗?ksize中的5个数字是什么?
欢迎您加入。
这里您正在使用Conv3D,有很多参数,您可以看到它们here conv3d和maxpool3d。
是,[1,3,3]是指您的过滤器尺寸。ksize是窗口的大小,本质上是您在使用maxpool时要考虑的尺寸。
Here是CNN的出色指南,其中介绍了所有内容。