回归的target根据输入anchor信息
(x_a,y_a,z_a,l_a,w_a,h_a,\theta_a)
进行编码如下:
其中d是anchor在2D平面上的对角线长。...ps: 实际上很多方法,包括作者的实现代码使用的并不是这种做法,而是类似2D通用检测的anchor offset encoding(参考Faster RCNN)。...3D box表征由中心
(x,y,z)
和形状
(l,w,h)
组成,变成四维就是中心
(x,y,z,t)
和形状
(l,w,h,k)
。...作者的做法是,直接取
t=\sin\theta\cdot\cos\theta
,而令
k=1
。可以看到,出发点很有趣,落脚点其实相对简单的。...图c显示中心存在一定偏移的case,此时3D IoU并不能很好地敏感角度变化,而RDIoU反而有更好的效果;图d中显示,此时3D IoU甚至出现正梯度,导致角度优化更差,而RDIoU则能保持较好的优化性能