CIA-SSD: Confident IoU-Aware Single-Stage Object Detector From Point Cloud
论文地址:http://arxiv.org/pdf/1907.03670v3.pdf
3D视觉技术相较于2D视觉能获取更丰富更全面的环境信息,已经成为机器人导航、无人驾驶、增强/虚拟现实、工业检测等领域的关键技术.当前基于2D的的计算机视觉技术日趋成熟,在很多领域取得了很不错的进展,但我们真实的世界是三维空间,利用2D的技术对真实世界进行建模存在先天的缺陷——深度信息缺失,我们不能从2D图片中获得物体的绝对尺度和位置,而这一点在点云中不会存在问题.“从单幅图像到双目视觉的3D目标检测算法”介绍了基于单目(monocular)视觉以及双目(binocular)视觉的3D目标检测算法,单目做3D检测完全是数据驱动,通过机器学习模型结合摄影几何的约束去拟合3D空间的数据分布;双目视觉会有额外的视差信息,可以重建出景深信息,所以可以得到比单目视觉更强的空间约束关系,在3D目标检测任务重的精度相比单目会更好.
本文盘点CVPR 2020 所有实例分割(Instance Segmentation)相关论文(语义分割在这里,不含全景分割、医学图像分割、交互式分割等,以上将会另行总结),总计18篇,对文献进行了分类汇总,希望对大家有帮助。
最近,来自香港大学的Jihan Yang和纽约大学的谢赛宁等人,联合发表了一项新研究:在虚拟环境中模拟现实世界。
标题:Learning Transferable Features for Point Cloud Detection via 3D Contrastive Co-training
LiDAR-Based Online 3D Video Object Detection With Graph-Based Message Passing and Spatiotemporal Transformer Attention
SLAM包含了两个主要的任务:定位与构图,在移动机器人或者自动驾驶中,这是一个十分重要的问题:机器人要精确的移动,就必须要有一个环境的地图,那么要构建环境的地图就需要知道机器人的位置。
感谢52CV群友“一块钱”盘点了CVPR 2019 所有有关目标检测的文章,并简单做了分类。
HybridCR: Weakly-Supervised 3D Point Cloud Semantic Segmentation via Hybrid Contrastive Regularization
【1】 Flying Guide Dog: Walkable Path Discovery for the Visually Impaired Utilizing Drones and Transformer-based Semantic Segmentation 标题:飞行导盲犬:基于无人机和Transformer的视障人士可行走路径发现 链接:https://arxiv.org/abs/2108.07007
【1】 Tensor-to-Image: Image-to-Image Translation with Vision Transformers 标题:张量到图像:使用视觉变换器进行图像到图像的转换 链接:https://arxiv.org/abs/2110.08037
【1】 Boosting Salient Object Detection with Transformer-based Asymmetric Bilateral U-Net 标题:基于Transformer的非对称双边U网增强显著目标检测 链接:https://arxiv.org/abs/2108.07851
【1】 Hierarchical Neural Dynamic Policies 标题:分层神经动态策略
领取专属 10元无门槛券
手把手带您无忧上云