为了掌握这个概念,我读了这篇由Mauricio Menegaz撰写的文章,并在YouTube上观看了Deeplearning.ai的video,但我对S x S x(B * 5 + C)部分感到困惑。我知道S x S代表网格大小,5代表边界框的组件,C代表类。 B和锚箱一样吗?如果我只想检测一个类(例如牌照),这是否意味着只有1个B?
编辑在图像被馈送到神经网络之前是否在图像上创建了边界框?
B和锚箱一样吗?
是的。 B是锚箱的数量
如果我只想检测一个类(例如牌照),这是否意味着只有1个B?
不,在这种情况下,C = 1.但是如果您事先知道需要检测的物体的宽高比,并且该比率在视点之间没有太大变化,则可能只需要与此比率匹配的锚箱,因此在你的车牌案例,B也可以是1
但是如果你需要检测汽车,你可能需要更多的锚箱,因为汽车的宽高比在两个观点之间变化很大
也许你可以看看这个实现:https://github.com/1991viet/Yolo-pytorch