👆点击“博文视点Broadview”,获取更多书讯
人工智能技术按照信息来源主要分为计算机视觉(视觉)、自然语言处理(文本)、语音识别(语音)三大方向。
其中,计算机视觉是需求最大、发展最快、应用最广泛的领域。
计算机视觉算法通常分为基于学习的方法和基于几何的方法。
前者主要指利用深度学习来实现图像识别、物体检测、物体分割、视频理解、图像生成等;后者主要指利用多视图立体几何来实现空间定位、三维重建、测距测绘等。
其中,基于几何方法的计算机视觉核心技术之一是同步定位与建图(Simultaneous Localization and Mapping,SLAM)。
SLAM技术最早应用于潜艇、太空车等军用领域,之后逐渐进入民用领域。
最近几年学术界诞生了大量优秀的SLAM算法框架,并且随着三维传感器的飞速发展和嵌入式设备算力的快速提升,SLAM技术开始大规模商业化应用,包括但不限于服务机器人、自动驾驶车辆、增强现实智能穿戴设备、智能无人机等。
那么什么是SLAM呢?
它是指移动智能体从一个未知环境里的未知地点出发,在运动过程中通过自身传感器观测周围环境,并根据环境定位自身的位置,再根据自身位置进行增量式的地图构建,从而达到同时定位和地图构建的目的。
对于初学者来说,很难从晦涩的定义中看懂SLAM技术到底在干什么,也无法理解机器人SLAM过程中有什么难点。
其实人类也能执行定位和建图的任务,为方便理解,这里不妨拿人类的探索过程和机器人视觉SLAM过程来做类比。
注意下面描述中括号内加粗文字表示的是机器人SLAM中的对应用语。
假设我们接到一个任务,需要在不借助专业设备的前提下,到一个陌生的地方探索并简单绘制当地的地图。我们如何完成上述任务呢?
流浪地球2中的机器人
SLAM 的不可替代性
SLAM主要作用就是定位和建图,我们现在经常用的手机地图导航软件不是也可以定位吗?而且里面全国的地图都可以下载,直接用这些软件不就可以了吗?
主要有以下几个原因:
特斯拉自动驾驶地图
目前SLAM相关的书籍比较少,虽然它们涵盖了该领域的核心知识点,公式推导严谨,有的还配套有重要概念的代码实现。但是,很多初学者在掌握了SLAM基础知识后发现距离真正的项目实践还有较大差距,他们对于如何开始自己的第一个SLAM项目实践比较迷茫。
《视觉惯性SLAM:理论与源码解析》则致力于解决这个问题,本书选取了经典的视觉SLAM框架和目前综合效果最好的视觉惯性SLAM框架进行庖丁解牛,引导读者循序渐进掌握自己的第一个SLAM项目。
本书内容
本书系统介绍以相机和惯性测量单元为主传感器的视觉、视觉惯性SLAM算法。
本书通过选取该领域有代表性的两个开源项目ORB-SLAM2、ORB-SLAM3,从原理阐述、公式推导、代码解析和工程经验等多个维度,对SLAM技术进行全面的解读。
本书兼具技术的广度和深度,适合有一定SLAM基础的高等院校学生、科研机构研究人员和企业从业者阅读,尤其适合希望深入研究视觉(惯性)SLAM的算法工程师参考。
本书理论和实践并重,引导读者循序渐进地掌握项目实践经验,具体有如下特点。
本书特点
本书兼具技术的广度和深度,适合有一定SLAM基础的高等院校学生、科研机构研究人员和企业从业者阅读,尤其适合希望深入研究视觉(惯性)SLAM的算法工程师参考。
本书理论和实践并重,引导读者循序渐进地掌握项目实践经验,具体有如下特点。
01. 第一本带领读者从头到尾学习一个完整的SLAM项目的图书。从原理解析、代码解读到工程技巧,一步一个脚印。
02. 本书从初学者的视角切入,部分章节以零基础的小白和经验丰富的师兄两人对话的形式阐述。对话形式一方面可以把初学者学习过程中的很多基础问题展现出来,帮助读者在学习过程中不断思考和提升,提高工程实践经验;另外对话这种口语化的表达方式能够让读者在轻松的氛围中快速理解专业理论知识。
03. 每个重要的知识点都尝试从三个角度去分析:“What (是什么?)”“Why(为什么?)”“How(怎么做?)”,让读者知其然也知其所以然。
04. 丰富的图示和类比。我们把大量复杂或难以理解的原理或流程绘制为具象化的图像,一图胜千言,极大降低了学习门槛。
05. 开源代码配套详细的中文注释。
06. 全书采用全彩印刷,提供极致阅读体验。
本书虽然是针对ORB-SLAM2/3系列的原理及代码解析,但其中涉及的知识点同样适用于其他同类算法,学习方法和思路也值得借鉴。
业界专家鼎力推荐
目前,同时定位与建图(SLAM)技术是机器人、自动驾驶、AR、VR等众多前沿领域的基础技术之一,应该得到充分的重视与普及。然而,面向大众读者的有关SLAM的书籍、材料仍然为数不多。本书作为一本介绍VSLAM技术的图书,做到了理论与实践充分结合,同时也详细地解释了开源代码的内容,值得高校学生、从业者阅读和借鉴。
——高翔 清华大学自动化系博士
视觉/视觉惯性SLAM技术对从业者的理论知识的掌握和编程水平要求都很高,导致很多初学者难以入门。本书以经典的ORB-SLAM2和ORB-SLAM3为学习对象,将相关原理和知识点介绍与源码解析有机结合起来,并通过有趣的对话形式和直观的示意图,循序渐进地引导读者学习和开发实践,显著降低了学习门槛。对于SLAM初学者来说,本书很值得一读。
——章国锋 浙江大学教授
视觉惯性SLAM是一项具有多学科背景、将理论知识与工程实践紧密结合的关键技术,学习难度大、门槛高。本书通过解析当下主流的ORB-SLAM2和ORB-SLAM3开源代码,并穿插介绍对应的数学理论知识,有助于初学者加深对视觉惯性SLAM的理解,对企业研发人员也有重要的参考价值。
——邹丹平 上海交通大学副教授
我和小六同学相识多年,他在SLAM领域深耕细作、寻根究底。本书是他在SLAM方向苦心孤诣、多年积累的心血。本书对SLAM领域经典的框架ORB-SLAM2和ORB-SLAM3做了全面、系统、详细的解读。本书将理论与代码相结合,有助于初学者对SLAM技术进行快速学习和使用。
——秦通 香港科技大学博士,SLAM经典算法VINS作者
视觉惯性SLAM作为一种基础技术,在机器人、自动驾驶、XR等领域有广泛而重要的应用价值。研究者和从业者学习视觉惯性SLAM,不但需要掌握多方面的理论知识,而且要求积累大量的实践经验,在实践中加深对理论的理解,探索新的方法,找到适合解决实际问题的系统设计和程序实现。本书围绕经典视觉SLAM框架ORB-SLAM系列,全面而详细地解析其算法原理和源代码实现,由浅入深、通俗易懂,为已有一定SLAM理论基础的进阶型读者提供了一个入门级的实践项目。本书所体现的学习思考和项目实践方法,也可以拓展到其他SLAM框架的学习上,值得读者仔细研读。
——吴克艰 美国明尼苏达大学博士,Nreal联合创始人
学习SLAM技术要内外兼修。本书手把手带你吃透ORB-SLAM经典框架,是很好的外功修炼手册。与网上诸多ORB-SLAM注解相比,本书最大的特点是提出非常多的“为什么”并给出精辟解答,让读者知其然且知其所以然,这展示了程博士多年积累的深厚功底。相信各阶段的SLAM学习者品读本书后,既能快速用于实战,也能对SLAM涉及的诸多理论查漏补缺、内化掌握。
——史雪松 复旦大学博士,高仙机器人SLAM算法总监
作者简介
本书由中国科学院博士、计算机视觉life平台创始人程小六老师历时多年,精心打磨。
程小六博士的研究兴趣为计算机视觉、机器人定位与建图,有丰富的视觉惯性SLAM从业经验。
限时五折优惠,快快扫码抢购吧!
发布:刘恩惠
审核:陈歆懿
如果喜欢本文欢迎 在看丨留言丨分享至朋友圈 三连< PAST · 往期回顾 >
技术在数字化转型过程中有哪些痛点?
点击阅读原文,查看本书详情!
本文分享自 博文视点Broadview 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!