大规模的目标检测数据集(例如MS-COCO)在进行Ground Truth框标注时仍然存在歧义。...因此,本文可以对四个坐标的方差进行单独的学习,而不只是IoU。var voting 通过由KL损失学习到的相邻边界框的方差来对选择的框产生新的位置。
3....通过Box std计算得到的KL损失函数反向传播修改Box中的坐标点位置和预测框的大小。这里用(x1,y1,x2,y2)代表预测边界框左上角和右下角的坐标。...(x1*,y1*,x2*,y2*)表示真实的边界框左上角和右下角的坐标。(x1a,x2a,y1a,y2a,wa,ha)是Anchor。...所以,论文在预测边界框位置的基础上又预测了一个位置的分布,这里假设坐标是独立的,为了简单起见,使用了单变量的高斯函数,如公式2所示:
式子中边界框坐标表示为x,因为我们可以独立地优化每个坐标,Θ是一组可以学习的参数