我的问题类似于这主题。当我开始思考yolo算法的输出时,我正在看Andrew关于边界盒预测的这讲座。让我们考虑这个例子,我们使用19x19网格,只有一个带有两个类的接收字段,所以我们的输出将是=> 19x19x1x5。最后一个维度(大小为5的数组)表示以下内容:
1) The class (0 or 1)
2) X-coordinate
3) Y-coordinate
4) height of the bounding box
5) Width of the bounding box我不明白X,Y坐标是代表整个图像大小的边界框,还是表示接受域(Filter)。在视频中,边框被表示为接收域的一部分,但逻辑上,接收域比边界框小得多,而且人们可能会修改过滤器的大小,因此,相对于过滤器定位边界框是没有意义的。
那么,基本上,图像的边界框的坐标代表什么?
发布于 2018-09-22 09:47:17
简单地说,左边是包围框的最高级顶点。
用X,Y和它的高度和宽度,你可以在图像中找到包围框。(关于整个图像的大小)
https://datascience.stackexchange.com/questions/38634
复制相似问题