首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

一文全览 | 2023最新环视自动驾驶3D检测综述!

基于视觉的3D检测任务是感知自动驾驶系统的基本任务,这在许多研究人员和自动驾驶工程师中引起了极大的兴趣。然而,使用带有相机的2D传感器输入数据实现相当好的3D BEV(鸟瞰图)性能并不是一项容易的任务。本文对现有的基于视觉的3D检测方法进行了综述,聚焦于自动驾驶。论文利用Vision BEV检测方法对60多篇论文进行了详细分析,并强调了不同的分类,以详细了解常见趋势。此外还强调了文献和行业趋势如何转向基于环视图像的方法,并记下了该方法解决的特殊情况的想法。总之,基于当前技术的缺点,包括协作感知的方向,论文为未来的研究提出了3D视觉技术的想法。

02

Stereo R-CNN based 3D Object Detection for Autonomous Driving

提出了一种充分利用立体图像中稀疏、密集、语义和几何信息的自主驾驶三维目标检测方法。我们的方法,称为Stereo R-CNN,扩展了Faster R-CNN的立体输入,以同时检测和关联目标的左右图像。我们在立体区域建议网络(RPN)之后添加额外的分支来预测稀疏的关键点、视点和目标维数,并结合二维左右框来计算粗略的三维目标边界框。然后,我们恢复准确的三维包围框,以区域为基础的光度比对使用左和右ROI。我们的方法不需要深度输入和三维位置监督,但是,优于所有现有的完全监督的基于图像的方法。在具有挑战性的KITTI数据集上的实验表明,我们的方法在三维检测和三维定位任务上都比目前最先进的基于立体的方法高出30%左右的AP。

02

首创!BEV-CV:用鸟瞰视角变换实现跨视角地理定位

因为航拍视角和地面视角之间有很大的差异,所以跨视角地理定位一直是一个难题。本文提出了一种新方法,可以利用地理参考图像进行定位,而不需要外部设备或昂贵的设备。现有的研究使用各种技术来缩小域间的差距,例如对航拍图像进行极坐标变换或在不同视角之间进行合成。然而,这些方法通常需要360°的视野,限制了它们的实际应用。我们提出了BEV-CV,这是一种具有两个关键创新的方法。首先,我们将地面级图像转换为语义鸟瞰图,然后匹配嵌入,使其可以直接与航拍分割表示进行比较。其次,我们在该领域首次引入了标准化温度缩放的交叉熵损失,实现了比标准三元组损失更快的收敛。BEV-CV在两个公开数据集上实现了最先进的召回精度,70°裁剪的特征提取Top-1率提高了300%以上,Top-1%率提高了约150%,对于方向感知应用,我们实现了70°裁剪的Top-1精度提高了35%。

01
领券