首个实时单目3D目标检测算法：RTM3D，代码将开源

CV君

发布于 2020-01-16 15:55:48

2.7K0

发布于 2020-01-16 15:55:48

文章被收录于专栏：我爱计算机视觉

o 点击我爱计算机视觉标星，更快获取CVML新技术

基于单目图像的3D目标检测是在输入RGB图像的情况下估计目标的3D包围框，在自动驾驶领域非常有用。

今天来自中科院沈阳自动化所等单位的学者公布论文提出一种实时的单目3D目标检测算法RTM3D，快速版30fps，并且代码将开源。

以下是作者信息：

RTM3D算法的主要思路，如图：

输入RGB图像，经过深度神经网络，预测目标的9个空间点（1个中心点，8个顶点），使用几何限制估计更加精确的9个空间点，进而找到目标的3D包围框。

下表为该文算法与其他3D目标检测方法比较，RTM3D不需要其他外部数据，而且速度达到实时。

算法架构图：

实验结果

在KITTI数据集上的实验结果，该算法在精度达到SOTA的同时，是目前少数达到实时的3D目标检测算法。

检测结果示例：

论文地址：

https://arxiv.xilesou.top/pdf/2001.03343.pdf

代码地址：

https://github.com/Banconxuan/RTM3D

目前代码还未放出，期待早日开源。

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2020-01-13，如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自我爱计算机视觉微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

登录后参与评论

0 条评论

热度