计算机视觉入门的一些综述类文章和经典pdf书籍,【3D视觉工坊】按照不同领域帮大家划分了下,涉及图像处理、计算机视觉、自动驾驶、立体视觉、深度估计、姿态估计、OpenCV、SLAM、点云处理、多视图几何、三维重建等~ 综述类文章 双目视觉的匹配算法综述 基于立体视觉深度估计的深度学习技术研究(综述) 单目图像的深度图估计:综述 机器视觉表面缺陷检测综述 A Review on Object PoseRecovery: from 3D Bounding Box Detectors to Full 6D Pos
代码地址:在公众号「计算机视觉工坊」,后台回复「PREDATOR」,即可直接下载。
PCL(Point Cloud Library)是在吸收了前人点云相关研究基础上建立起来的大型跨平台开源C++编程库,它实现了大量点云相关的通用算法和高效数据结构,涉及到点云获取、滤波、分割、配准、检索、特征提取、识别、追踪、曲面重建、可视化等。支持多种操作系统平台,可在Windows、Linux、Android、Mac OS X、部分嵌入式实时系统上运行。如果说OpenCV是2D信息获取与处理的结晶,那么PCL就在3D信息获取与处理上具有同等地位,PCL是BSD授权方式,可以免费进行商业和学术应用
本文介绍了关于多视图几何、Python语言以及深度学习的相关资料。首先,介绍了多视图几何的相关概念和常用算法,包括旋转矩阵、平移矩阵、投影映射和点云处理等。接着,介绍了Python语言中PCL库的安装方式和示例代码,以及该库在点云处理中的应用。最后,分享了关于深度学习的一些学习资料,包括视频课程和书籍等。希望通过本文的分享,能够对读者在多视图几何、Python语言以及深度学习方面的学习有所帮助。
Robust Point Cloud Registration Framework Based on Deep Graph Matching
近些年来,随着计算机软硬件等的不断发展,计算机视觉、现实增强等让那些我们觉得不会发生的事情发生了,不得不说,科技正在改变我们的生活,给我们的生活带来了更多的便利。
这是3D 点云的深度学习框架,提供常见的点云分析方法的一种通用深度学习模型。它主要依赖Pytorch Geometric和Facebook Hydra。该框架能够以最小的代价和极大的可重复性来构建精简而复杂的模型。目标是建立一个工具,用于对SOTA模型进行基准测试,同时允许研究者们有效地研究点云分析,最终目标是建立可应用于实际应用的模型。
3D点云学习( Point Clouds)作为近年来的研究热点之一,受到了广泛关注,每年在各大会议上都有大量的相关文章发表。当前,点云上的深度学习变得越来越流行,人们提出了许多方法来解决这一领域的不同问题。国防科技大学郭裕兰老师课题组新出的这篇论文对近几年点云深度学习方法进行了全面综述,是第一篇全面涵盖多个重要点云相关任务的深度学习方法的综述论文,包括三维形状分类、三维目标检测与跟踪、三维点云分割等,并对点云深度学习的机制和策略进行全面的归纳和解读,帮助读者更好地了解当前的研究现状和思路。也提供了现有方法在几个可公开获得的数据集上的全面比较,最后也介绍了未来的研究方向。
Semantic Segmentation for Real Point Cloud Scenes via Bilateral Augmentation and Adaptive Fusion
导读/ 3D点云学习( Point Clouds)作为近年来的研究热点之一,受到了广泛关注,每年在各大会议上都有大量的相关文章发表。当前,点云上的深度学习变得越来越流行,人们提出了许多方法来解决这一领域的不同问题。国防科技大学郭裕兰老师课题组新出的这篇论文对近几年点云深度学习方法进行了全面综述,是第一篇全面涵盖多个重要点云相关任务的深度学习方法的综述论文,包括三维形状分类、三维目标检测与跟踪、三维点云分割等,并对点云深度学习的机制和策略进行全面的归纳和解读,帮助读者更好地了解当前的研究现状和思路。也提供了现有方法在几个可公开获得的数据集上的全面比较,最后也介绍了未来的研究方向。
在工业界,利用激光雷达获取点云数据,很早就有应用了,如进行测高、遥感等。近几年的大规模发展得益于自动驾驶和机器人领域的火热,激光雷达成为重要的感知手段而得到人们关注,点云处理也成为热门。
上周花了半天时间在Windows下安装pytorch库,这里记录了参考博客和踩坑过程,我也不知道我能坚持多久,但我想通过记录的方式让这个过程更有趣,更有意义,期待朋友们的一起分享,理论课程固然重要,但实践出真知,所以还是先配置环境,并运行一些实例激发我们的兴趣吧!
在上一篇中,我们介绍了什么是3D相机。但是对于初次接触3D相机的同学,可能首先面临的问题是如何处理3D相机得到的数据。3D相机的数据分为两种方式:三维点云数据方式,二维数据方式。其中,三维数据保存的格式有csv,txt,ply,stl等。二维数据通常以二维图像的形式存在,其中保存Z方向的二维图像被称为深度图像。本篇主要介绍一下深度图像的生成与处理。
MVS是一种从具有一定重叠度的多视图视角中恢复场景的稠密结构的技术,传统方法利用几何、光学一致性构造匹配代价,进行匹配代价累积,再估计深度值。虽然传统方法有较高的深度估计精度,但由于存在在缺少纹理或者光照条件剧烈变化的场景中的错误匹配,传统方法的深度估计完整度还有很大的提升空间。
过去十年来,深度学习方法(例如卷积神经网络和递归神经网络)在许多领域取得了前所未有的成就,例如计算机视觉和语音识别。
本文仅做学术分享,如有侵权,请联系删除。欢迎各位加入免费知识星球,获取PDF论文,欢迎转发朋友圈。内容如有错误欢迎评论留言,未经允许请勿转载!
此外,Kaolin 库还可以大大降低为深度学习准备 3D 模型的工作量,代码可由 300 行锐减到仅仅 5 行。
随着传感器技术的发展和大量新兴应用场景(AR/VR/自动驾驶)的出现,三维深度学习成为了近期的研究热点。三维数据往往以点云的方式存储,近年来,研究人员抑或是选择先将点云离散化成结构化的、规整的栅格形式(voxels,可以类比 2D 的像素 pixels),再利用体素卷积神经网络(volumetric CNNs,可以看作 2D CNN 的三维推广)对栅格数据进行处理;抑或是选择直接在点云数据上进行卷积计算。
腾讯多媒体实验室专栏 基于全景图的空间场景重建技术在各类沉浸式媒体解决方案中有着广泛的应用,比如 VR 看房,虚拟展厅等,也是近年来学术界和工业界在积极研究的一个难题。本文主要介绍了腾讯多媒体实验室在该领域的研究进展。通过自研深度学习网络和 3D 计算机视觉技术的结合,解决了在复杂场景下全景图点云重建的难题,成功实现了通过全景图即可算法重建空间点云的效果。目前,该技术已经应用于腾讯多媒体·点云产品中。 随着三维视觉技术的发展,三维视觉已经逐步渗透到各个领域,在 AR / VR、自动驾驶、三维重建等领域
三维重建算法广泛应用于手机等移动设备中,常见的算法有SfM,REMODE和SVO等。
在过去的几年中,基于RGB的深度学习已经在目标分类与语义分割方面取得了非常好的效果,也促进了很多技术的发展,深度学习在现实生活中的应用也越来越多。但是在很多实际应用中,例如自动驾驶中,只使用RGB信息是远远不够的,因为我们不仅仅想要知道周围有什么物体,还想要知道物体具体的三维信息(位置,运动状态等),因此,三维方面的深度学习也逐渐发展了起来并取得了不错的效果。
文章:Annotation Tool and Urban Dataset for 3D Point Cloud Semantic Segmentation
原文:Deep Learning on Monocular Object Pose Detection and Tracking: A Comprehensive Overview
本文为《Deep Learning for LiDAR Point Clouds in Autonomous Driving: A Review》译文,在原文的基础上译者会稍作修改提炼,方便大家学习理解。
[1] Zhengxin Mi#, Yiming Luo#, Wenbing Tao*. SSRNet: Scalable 3D Surface Reconstruction Network. CVPR 2020.
很多粉丝在公众号后台留言,不知如何入门3D视觉、3D领域的主线是什么,一些难点该如何解决,有哪些方法,导师新开的3D视觉方向无人指导等等。这些痛点,工坊的许多童鞋都踩过坑,也为大家提出了许多非常有价值的问题和解决思路,涵盖了计算机视觉与深度学习、点云处理、SLAM、三维重建、结构光、双目视觉、深度估计、3D检测、自动驾驶、多传感器融合等多个方向,超详细的问题和资料汇总请移步至【3D视觉从入门到精通知识星球】,一个有点干货的学习社区!
随着三维探测技术的发展,点云逐渐成为最常用的三维物体/场景表征的数据类型之一,广泛应用于自动驾驶、虚拟/增强现实、文物修复以及虚拟导览等诸多场景。
在过去的这些年里,对二维图像已经有了大量深入的研究,并且有着长足的发展。它在分类任务上取得了极好的结果主要得益于一下两个关键因素:
精选论文学习分享,实时分享当前热点算法。论文学习、下载,请关注公众号:CNNer
文章:FEC: Fast Euclidean Clustering for Point Cloud Segmentation
利用激光雷达的点云信息检测闭环是一件很不容易的事情,因为激光雷达的数据是不稳定的。本文提出了一种叫做GOSMatch的方法依靠语义级别的信息做场景重识别,本文的方法利用语义物体之间的空间关系产生新颖的描述符。本文还设计了一种由粗到细的测量来有效的找到闭环。此外, 一旦确定找到了闭环帧,系统就会给出准确的六自由度的位姿估计结果,本文在kitti做了测试取得了不错的效果。
CVPR 2021 相关论文、代码 、解读和demo整理,同时为了方便下载论文,已把部分论文上传到上面了,欢迎小伙伴们 star 支持一波!
近年来,深度学习在解决图像分类、目标识别、语义分割等 2D 图像任务方面的表现都很出色。不仅如此,深度学习在 3D 图像问题中的应用也取得了很大的进展。本文试着将深度学习扩展到单个 2D 图像的 3D 重建任务中,这是 3D 计算机图形学领域中最重要也是最有意义的挑战之一。
文章:Deep Learning for Image and Point Cloud Fusion in Autonomous Driving: A Review
“SFFAI114期来自南洋理工大学的潘亮推荐的文章主要关注于计算机视觉的点云处理领域,你可以认真阅读讲者推荐的论文,来与讲者及同行线上交流哦。”
本文是关于PointNet点云深度学习的翻译与理解,PointNet是一种直接处理点云的新型神经网络,它很好地体现了输入点云的序列不变性。
多视角三维重建(MVS)是计算机领域的一项基础任务,目标是通过相机拍摄的图像和相机参数推导出现实环境中物体的三维信息。不同角度拍摄的图像会存在一些公共部分,合理分析并利用不同图像的关联是三维重建的基础。
论文题目:BlendedMVS: A Large-scale Dataset for Generalized Multi-view Stereo Networks
机器人需要在这个过程中学会如何主动感知和控制,深度学习的流行也为探索这一问题提供了一种值得借鉴和学习的方法。
机器之心报道 机器之心编辑部 2021 年冬季的 CSC 2547 课程已全部上线,公开可看。 随着神经渲染等方法的成熟,3D 计算机视觉领域也有了诸多进展。对于从事机器人、生物识别等方向的研究人员和从业者来说,掌握几何深度学习知识和 3D 计算机视觉的相关算法是非常必要的。 CSC 2547 是多伦多大学的一门课程,主要介绍了几何深度学习方法和 3D 视觉的最新进展。近期 2021 年冬季的 CSC 2547 课程已全部上线,课程视频和讲义资料均公开可看。 该课程首先讲解了物体和场景级别的 3D 视觉任
点云补全(Point Cloud Completion)用于修补有所缺失的点云(Point Cloud),从缺失点云出发估计完整点云,从而获得更高质量的点云。点云有助于用较小的数据量描述三维物体,在三维物体的检测识别领域应用广泛。在 PointNet[1] 和 PointNet++[2] 使用深度学习网络实现了点云分割和点云分类之后,点云深度学习逐渐成为热门研究领域。但是,从激光雷达等设备中获取的点云往往有所缺失,这给点云的后续处理带来了一定的困难,也凸显出点云补全作为点云预处理方法的重要性。
目前,三维重建技术已在游戏、电影、测绘、定位、导航、自动驾驶、VR/AR、工业制造以及消费品领域等方面得到了广泛的应用。方法同样也层出不穷,我们将这些方法依据原理分为两类:
环境感知了确保无人车对环境的理解和把握,无人驾驶系统的环境感知部分通常需要获取周围环境的大量信息,具体来说包括:障碍物的位置,速度以及可能的行为,可行驶的区域,交通规则等等。无人车通常是通过融合激光雷达(Lidar),相机(Camera),毫米波雷达(Millimeter Wave Radar)等多种传感器的数据来获取这些信息,本节我们简要地了解一下激光雷达和相机在无人车感知中的应用。
本文为美团点评无人配送部技术团队主笔,为您带来的是自动驾驶中的激光雷达目标检测。(本文来源:美团无人配送)
标题:Review on 3D Lidar Localization for Autonomous Driving Cars
SLAM算法是移动机器人实现自主移动的关键环节。激光雷达(LiDAR)具有测距精度高、不易受外部干扰和地图构建直观方便等优点,广泛应用于大型复杂室内外场景地图的构建。随着3D激光器的应用与普及,国内外学者围绕基于3D激光雷达的SLAM算法的研究已取得丰硕的成果。
环境感知确保了无人车对环境的理解和把握,无人驾驶系统的环境感知部分通常需要获取周围环境的大量信息,具体来说包括:障碍物的位置,速度以及可能的行为,可行驶的区域,交通规则等等。无人车通常是通过融合激光雷达(Lidar),相机(Camera),毫米波雷达(Millimeter Wave Radar)等多种传感器的数据来获取这些信息,本节我们主要介绍一下激光雷达和摄像机在无人驾驶感知中的应用。
领取专属 10元无门槛券
手把手带您无忧上云