前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【深度学习】目标检测中 IOU 的概念及计算

【深度学习】目标检测中 IOU 的概念及计算

作者头像
Frank909
发布2019-06-14 17:39:11
4.7K0
发布2019-06-14 17:39:11
举报
文章被收录于专栏:Frank909

在目标检测当中,有一个重要的概念就是 IOU。一般指代模型预测的 bbox 和 Groud Truth 之间的交并比。

何为交并比呢?

IOU=A∩BA∪B IOU = \frac{A\cap B}{A\cup B} IOU=A∪BA∩B​

在这里插入图片描述
在这里插入图片描述

集合 A 和集合 B 的并集包括了上面 3 种颜色区域。

集合 C 是集合 A 与集合 B 的交集。

在目标检测当中,IOU 就是上面两种集合的比值。

A∪BA \cup BA∪B 其实就是 A+B−CA + B - CA+B−C。

那么公式可以转变为: IOU=A∩BA+B−(A∩B) IOU = \frac{A \cap B}{A + B - (A \cap B)} IOU=A+B−(A∩B)A∩B​

IOU 衡量两个集合的重叠程度。

  • IOU 为 0 时,两个框不重叠,没有交集。
  • IOU 为 1 时,两个框完全重叠。
  • IOU 取值为 0 ~ 1 之间的值时,代表了两个框的重叠程度,数值越高,重叠程度越高。

在 2D 目标检测当中,因为 bbox 是矩形,所以很容易求得 IOU。

方框 A 和 B 相交,典型的情况如下:

在这里插入图片描述
在这里插入图片描述

A 和 B 的面积容易求得,C 的面积稍微繁琐一点,但耐心细致的话可以求得。

如果利用数学思维,细心整理,可以发现面积 C 只需要求得边长的乘积就好,即使 A 和 B 的位置是相对的,但稍加变换也能够求出。

如果以 W 代表 A 和 B 的交集 C 的 x 轴方向上的边长,那么有

W=min(A.x1,B.x1)−max(A.x0,B.x0) W = min(A.x_{1},B.x_{1}) - max(A.x_{0},B.x_{0}) W=min(A.x1​,B.x1​)−max(A.x0​,B.x0​)

同理,

H=min(A.y1,B.y1)−max(A.y0,B.y0) H = min(A.y_{1},B.y_{1}) - max(A.y_{0},B.y_{0}) H=min(A.y1​,B.y1​)−max(A.y0​,B.y0​)

大家仔细观察上面的对应关系,可以发现公式是成立的。这个公式的推导并不难,无非是 4 个顶点的坐标的相对位置变换,大家可以自行琢磨。

如果 A 与 B 根本就不相交。

在这里插入图片描述
在这里插入图片描述

这个时候可以发现 W <= 0 或 H <= 0.

下面是 Python 代码。

代码语言:javascript
复制
class BBox:
    def __init__(self,x,y,w,h):
        self.x = x
        self.y = y
        self.w = w
        self.h = h

def iou(a,b):

    assert isinstance(a,BBox)
    assert isinstance(b,BBox)

    area_a = a.w * a.h
    area_b = b.w * b.h

    w = min(b.x+b.w,a.x+a.w) - max(a.x,b.x)
    h = min(b.y+b.h,a.y+a.h) - max(a.y,b.y)

    if w <= 0 or h <= 0:
        return 0

    area_c = w * h

    return area_c / (area_a + area_b - area_c)



if __name__ == '__main__':

    a = BBox(1,1,4,5)
    b1 = BBox(1,1,4,5)
    b2 = BBox(5,1,4,5)
    b3 = BBox(3,2,3,6)


    print("iou ",iou(a,b1))
    print("iou ",iou(a,b2))
    print("iou ",iou(a,b3))

运行结果如下:

代码语言:javascript
复制
iou  1.0
iou  0
iou  0.26666666666666666
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2019年06月10日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
图像识别
腾讯云图像识别基于深度学习等人工智能技术,提供车辆,物体及场景等检测和识别服务, 已上线产品子功能包含车辆识别,商品识别,宠物识别,文件封识别等,更多功能接口敬请期待。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档