为了理解这个概念,我阅读了莫里西奥·梅内加兹写的这篇文章,看了Deeplearning.ai在YouTube上的一篇文章,但是我对S (B *5 +C)部分感到困惑。我知道S代表网格大小,5代表包围框的组件,C代表类。B和锚箱一样吗?如果我只想检测一个类别(例如车牌),这是否意味着只有1B?
编辑是在图像被输入到神经网络之前在图像上创建边界框吗?
发布于 2018-08-08 05:49:21
B和锚箱一样吗?
是的,是的。B是锚盒的数目。
如果我只想检测一个类别(例如车牌),这是否意味着只有1B?
不,在这种情况下,C= 1。但是如果你事先知道你需要检测的物体的宽度/高度比,而且这个比率在视点之间变化不大,你可能只需要匹配这个比率的锚盒,所以在车牌的情况下,B也可以是1。
但是,例如,如果您需要检测汽车,您可能需要更多的锚盒,因为车辆的宽度/高度比在不同的视角之间差异很大。
发布于 2018-09-03 21:52:00
也许您可以看看这个实现:https://github.com/1991viet/Yolo-pytorch
https://stackoverflow.com/questions/51737958
复制相似问题