开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

计算机视觉中的细节问题

共 7 篇文章

1

计算机视觉中的细节问题(九)

2

计算机视觉中的细节问题(八)

3

计算机视觉中的细节问题(七)

4

计算机视觉中的细节问题(五)

5

计算机视觉中的细节问题(四)

6

计算机视觉中的细节问题(二)

7

计算机视觉中的细节问题

清单首页计算机视觉中的细节问题文章详情

清单「计算机视觉中的细节问题」 01/07

计算机视觉中的细节问题(九)

(1)、目标检测中NMS的原理

对于Bounding Box的列表B及其对应的置信度S，采用下面的计算方式。选择具有最大score的检测框M，将其从B集合中移除并加入到最终的检测结果D中。通常将B中剩余检测框中与M的IoU大于阈值Nt的框从B中移除。重复这个过程,直到B为空。

重叠率(重叠区域面积比例IOU)阈值

常用的阈值是0.3~0.5. 其中用到排序，可以按照右下角的坐标排序或者面积排序，也可以是通过SVM等分类器得到的得分或概率，R-CNN中就是按得分进行的排序。

就像上面的图片一样，定位一个车辆，最后算法就找出了一堆的方框，我们需要判别哪些矩形框是没用的。非极大值抑制的方法是：先假设有6个矩形框，根据分类器的类别分类概率做排序，假设从小到大属于车辆的概率分别为A、B、C、D、E、F。

从最大概率矩形框F开始，分别判断A~E与F的重叠度IOU是否大于某个设定的阈值；
假设B、D与F的重叠度超过阈值，那么就扔掉B、D；并标记第一个矩形框F，是我们保留下来的；
从剩下的矩形框A、C、E中，选择概率最大的E，然后判断E与A、C的重叠度，重叠度大于一定的阈值，那么就扔掉；并标记E是我们保留下来的第二个矩形框；

就这样一直重复，找到所有被保留下来的矩形框。R-CNN中使用了NMS来确定最终的bbox，其对每个候选框送入分类器，根据分类器的类别分类概率做排序(论文中称为greedy-NMS)。

举报