论文:https://arxiv.org/pdf/2307.07662.pdf
摘要:边界框回归(BBR)已广泛应用于对象检测和实例分割,是对象定位的重要步骤。 然而,当预测框与真实框具有相同的长宽比,但宽度和高度值完全不同时,大多数现有的边界框回归损失函数无法优化。 为了解决上述问题,我们充分挖掘水平矩形的几何特征,提出了一种基于最小点距离的新型边界框相似度比较度量MPDIoU,它包含了现有损失函数中考虑的所有相关因素,即重叠 或非重叠区域、中心点距离、宽高偏差,同时简化计算过程。 在此基础上,我们提出了一种基于 MPDIoU 的边界框回归损失函数,称为 LMPDIoU 。 实验结果表明,MPDIoU 损失函数适用于在 PASCAL VOC、MS COCO 和 IIIT5k 上训练的最先进的实例分割(例如 YOLACT)和对象检测(例如 YOLOv7)模型优于现有的损失函数。
具有不同边界框回归结果的两种情况。绿色框表示真实边界框,红色框表示预测边界框。 这两种情况之间的 LGIoU 、 LDIoU 、LCIoU 、 LEIoU 的值完全相同,但LMPDIoU不同
在分析了上面提到的基于 IoU 的损失函数的优缺点后,我们开始思考如何提高边界框回归的准确性和效率。 一般来说,我们使用左上角和右下角的坐标来定义一个唯一的矩形。 受边界框几何特性的启发,我们设计了一种名为 MPDIoU 的新颖的基于 IoU 的度量,以直接最小化预测边界框与真实边界框之间的左上角和右下点距离。 MPDIoU 算法流程如下:
图 4:具有相同长宽比但不同宽度和高度的预测边界框和真实边界框的示例,其中 k > 1 且 k ∈ R,绿色框表示真实框,红色框表示预测框。
实验
核心代码:
elif MPDIou: # https://arxiv.org/pdf/2307.07662.pdf by AI&CV
cw2 = torch.pow(cw ** 2 + eps, alpha)
ch2 = torch.pow(ch ** 2 + eps, alpha)
d12 = ((b2_x1 - b1_x1) - (b2_y1 - b1_y1)) ** 2
d22 = ((b2_x2 - b1_x2) - (b2_y2 - b1_y2)) ** 2
return iou - ((d12 + d22) / (cw2 + ch2))
详见:https://blog.csdn.net/m0_63774211/article/details/131991064
2023腾讯技术创作特训营第二期有奖征文,瓜分万元奖池和键盘手表
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。