3D Detection paperreading

## URL paper: RangeDet:In Defense of Range View for LiDAR-based 3D Object Detection https://arxiv.org/abs/2103.10039

TL;DR

range view较多用于语义分割任务,在检测中应用较少,之前有的方法相对于BEV,Point View的方法性能差不少,本文分析了造成range view方法效果差的原因,并据此提出了RangeDet, 在range view方法中取得了一个比较大的提高。

Dataset/Algorithm/Model/Experiment Detail

文章认为造成之前range view方法效果较差的原因主要有两个

  • 点云分布近处密集远处稀疏,近处远处目标尺度不同
  • 提取特征的所使用的二维坐标系和输出的三维笛卡尔坐标系不一致

为了探索为什么基于距离视图的激光雷达探测结果不如其他表示形式?作者检查了当前基于距离视图的检测器的设计,发现了几个被忽视的事实(range view表现不好的原因):

  • range view中物体尺寸变化较大,近大远小
  • range view中提取特征的2D卷积使用2D 坐标,然而输出是3D空间;
  • range view提取的特征更为稠密,但是先前的range view方法没有利用上这点

针对这些问题,文章分别提出了Range Conditioned Pyramid, Meta-Kernel, weighted Non-Maximum Suppression。

Range Conditioned Pyramid 2d 检测的特征金字塔主要是对不同scale的物体采取不同的策略,在不同的level上进行检测。而range view是柱坐标,按照远近range来放置,将0-80m的距离分为[0, 15), [15, 30), [30, 80]三个区间,不同的区间采用不同的特征图来检测。

Meta-Kernel Convolution 文章认为近处和远处的卷积核覆盖的范围不同应该使用不同的权重

整体结构:

Waymo数据集上的结果比较

Thoughts

3D检测中加FPN效果提升不大,在BEV上改动是一个思路,在点云空间改动也是一个思路,多考虑在range上的差别。

range view实际上更适合物理旋转式扫描的激光雷达的特殊view,其扫描出来的坐标系更像是柱坐标系。文章的方法针对range view取得了比较大的提高,但是目前很多雷达采用了固态激光雷达。虽然固态激光雷达也有不少缺点,但是具有小型化、低成本的优势,而且近些年发展很快是未来的一个趋势。个人认为目前不需要在range view上花费太多精力。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • ECCV 2020论文大盘点-3D目标检测篇

    [1].Generative Sparse Detection Networks for 3D Single-shot Object Detection

    小白学视觉
  • 一文看尽21篇目标检测最新论文(腾讯/Google/商汤/旷视/清华/浙大/CMU/华科/中科院等)

    CVer 有几天没更新论文速递了,主要是这段时间的论文太多,而且质量较高的论文也不少,所以为了方便大家阅读,我已经将其中的目标检测(Object Detecti...

    Amusi
  • Lidar Point clound processing for Autonomous Driving

    A list of references on lidar point cloud processing for autonomous driving

    点云PCL博主
  • CVPR 2020 论文大盘点-目标检测篇

    LiDAR-Based Online 3D Video Object Detection With Graph-Based Message Passing an...

    CV君
  • 基于YOLO和K-Means聚类的影像与点云数据三维目标检测方法 (CS)

    基于激光雷达的3D对象检测和分类等任务对于自动驾驶至关重要。激光雷达传感器能够提供场景重建的三维点云数据。然而,点云实时目标探测仍需要强大的算法。本文提出了一种...

    DDDDDaemon
  • 人脸检测识别文献代码

    人脸对齐 Dense Face Alignment ICCVW2017 MatConvNet code model can run at re...

    用户1148525
  • Center-based 3D Object Detection and Tracking

    三维物体通常表示为点云中的三维框。 这种表示模拟了经过充分研究的基于图像的2D边界框检测,但也带来了额外的挑战。 3D世界中的目标不遵循任何特定的方向,基于框的...

    狼啸风云
  • 基于深度学习的医疗影像论文汇总(Deep Learning Papers on Medical Image Analysis)

    看到好东西,怎么能不分享呢。 第一次在知乎翻译,由于水平有限(不是谦虚的那种有限,是真的有限),有不准确的地方还望包涵,最重要的是,还望大佬们多多指正! B...

    AI研习社
  • 95 FPS!超快速3D目标检测网络开源了!SFA3D:基于LiDAR的实时、准确的3D目标检测模型

    Amusi 发现了一个超快速3D目标检测网络!SFA3D:基于LiDAR的实时、准确的3D目标检测模型,在GTX 1080 Ti上速度高达95 FPS!代码现已...

    Amusi
  • AAAI 2021 3D目标检测论文大盘点(CIA-SSD/Voxel R-CNN等)

    CIA-SSD: Confident IoU-Aware Single-Stage Object Detector From Point Cloud

    Amusi
  • PI-RCNN:一种基于点注意力转化融合模块的多传感器数据3D对象检测方法(CS)

    LIDAR点云和RGB图像对于3D对象检测都是极其重要的。如此众多的3D检测算法致力于有效地融合这两种类型的数据。但是,它们基于Birds Eye View(B...

    DDDDDaemon
  • 基于压缩感知的实质摔倒检测(cs CV)

    跌倒检测在医疗保健领域极为重要,在该领域中及时检测就意味着能提供即时医疗帮助。在这种情况下,我们提出了一种3D ConvNet架构,该架构由用于跌倒检测的3D ...

    DANDAN用户6837186
  • 近期激光雷达点云的3D目标检测方法

    来源丨https://zhuanlan.zhihu.com/p/370650927

    计算机视觉
  • 3D多目标跟踪的两阶段数据关联方法

    多对象跟踪(MOT)是任何自动驾驶管道的组成部分,因为它会产生场景中其他运动对象已经捕获的轨迹,并有助于预测它们的未来运动。得益于深度学习在3D对象检测方面的最...

    YH
  • 一种用于三维物体检测的端到端变压器模型

    我们提出3DETR,一种基于3D点云的端到端的变压器物体检测模型。与现存的利用许多特定于3D的诱导偏差的检测方法相比,3DETR对香草变压器块需要极少的更改。具...

    阿秋
  • CVPR2021 最新出炉的最佳paper,陆续更新中...(附论文地址)

    Instance Localization for Self-supervised Detection Pretraining

    计算机视觉研究院
  • 从CVPR2017 看多样目标检测

    1、导读 When you have trouble with object detection, keep calm and use deep learnin...

    用户1332428
  • 【论文推荐】最新七篇目标检测相关论文—Self Paced、上下文注意力、特征反射、层次特征、Tiny SSD、少样本、协同学习

    【导读】专知内容组整理了最近七篇目标检测(Object Detection)相关文章,为大家进行介绍,欢迎查看! 1. Self Paced Deep Lear...

    WZEARW
  • 怎么样去处理样本不平衡问题 | (文后分享大量检测+分割框架)

    《Residual Objectness for Imbalance Reduction》。样本不平衡问题感觉近期研究的论文相对较多,如:2019 AAAI G...

    计算机视觉研究院

扫码关注云+社区

领取腾讯云代金券