本文作者:Augus https://zhuanlan.zhihu.com/p/235533342 本文已由原作者授权,不得擅自二次转载
表示
L2 loss, L1 loss, Smooth L1 loss
smooth L1 loss 相对于 L2 loss的优点:
动机
在one-stage检测算法中,会出现正负样本数量不平衡以及难易样本数量不平衡的情况,为了解决则以问题提出了focal loss。
hit的检测框就是正样本。容易的正样本是指置信度高且hit的检测框,困难的负样本就是置信度低但hit的检测框,容易的负样本是指未hit且置信度低的检测框,困难的负样本指未hit但置信度高的检测框。
表现形式
目的是解决样本数量不平衡的情况 - 正样本loss增加,负样本loss减小 - 难样本loss增加,简单样本loss减小
参考配置:
,
本文由旷视提出,发表于2016 ACM
UnitBox: An Advanced Object Detection Network
4个坐标点独立回归的缺点
相同的L1 loss和L2 loss,但是IOU不同
表示
优点
尺度不变性,也就是对尺度不敏感(scale invariant), 在regression任务中,判断predict box和gt的距离最直接的指标就是IoU。(满足非负性;同一性;对称性;三角不等性)
IOU缺点
相同的IOU,重合度不同
公式表示
C表示包含两个框的最小矩形
优点
GIOU Loss 的缺点
当目标框完全包裹预测框的时候,IoU和GIoU的值都一样,此时GIoU退化为IoU, 无法区分其相对位置关系,如下图三种情况GIOU loss是完全一致的。
预测框被完全包裹时有相同的GIOU loss
公式表示
其中
表示欧式距离,分子d表示GT框和Inference框中心点距离的平方,分母c表示GT框和Inference框最小外接矩形的对角线距离。
公式中分子d和分母c的说明
DIOU的优点
DIOU的问题
DIOU没有考虑到检测框的长宽比。长宽比更接近的边框应当有更低的loss。
公式表示
参数
是个trade off的参数,参数
用来衡量长宽比一致性
1. https://zhuanlan.zhihu.com/p/101303119
2. https://zhuanlan.zhihu.com/p/104236411
3. https://zhuanlan.zhihu.com/p/80594704