为什么更快 - rcnn ssd使用3x3过滤器来预测盒子位置和类别标签?

问题描述 投票:0回答:1

我正在阅读用于对象检测的更快的rcnn和ssd代码。预测层使用3x3过滤器来预测框位置和类标签。

为什么不使用2x2滤波器或4x4滤波器或5x5滤波器来预测它们?

enter image description here

deep-learning computer-vision object-detection faster-rcnn
1个回答
0
投票

这只是超参数的选择。这样的选择可以通过超参数搜索的交叉验证来进行,这意味着训练具有不同超参数选择的一些模型,并且看看谁在验证集上获得了最佳性能。特别是对于3x3卷积,这已经变得流行,因为VGG paper表明堆叠许多3x3卷积(被认为是小内核)可以提供良好的性能。

© www.soinside.com 2019 - 2024. All rights reserved.