专栏首页计算机视觉life从零开始一起学习SLAM | 为什么要学SLAM?

从零开始一起学习SLAM | 为什么要学SLAM?

在《零基础小白,如何入门计算机视觉?》中我提到过,计算机视觉的研究目前主要分为两大方向:基于学习的方法和基于几何的方法。其中基于学习的方法最火的就是深度学习,而基于几何方法最火的就是视觉SLAM。

SLAM将成为计算机视觉的下一个风口

在前几年计算机视觉的三大顶级会议(CVPR,ICCV,ECCV)上,几乎全是深度学习的研究,而这样的情况在这两年出现了新的变化:在2018年计算机视觉国际顶级会议 CVPR论文录用名单中,其中涉及SLAM/三维视觉 的工作超过 90 篇,占据了全体收录论文的近 1/10。

而今年参加校招和社招的小伙伴也向我透露,今年深度学习方向的竞争非常激烈,想要拿到较好的offer,要么有牛叉闪闪的论文,要么是大牛实验室有过硬的项目经验,难度比前几年大大提升。而今年SLAM方向的需求量上升而相关从业者相对较少,相对还比较容易,类似几年前深度学习刚刚火起来之前的样子。可以预见,SLAM将成为继深度学习之后计算机视觉领域的下一个风口。主要有以下几个依据:

1、深度学习在检测、识别领域具有无比强大的能力,但是在涉及多视角几何相关的SLAM领域,深度学习的作用非常有限。究其原因是因为在多视角几何为基础的SLAM领域,需要明确清晰的理论基础保证,而深度学习的「黑盒子」模型目前还不太奏效。

2、SLAM技术门槛较高。深度学习爆发后,很多非计算机视觉领域的从业者纷纷转而学习深度学习,由于深度学习本身黑盒子的特点,很多从业者不需要了解图像处理、计算机视觉的基础知识便可以得到一个相对较好的结果,因此入门门槛并不是很高。

而学习SLAM则需要具备三维空间刚体变换、相机成像模型、特征点提取与匹配、多视角几何、捆集调整等内容。这对于非该领域的从业者来说还是具有较高的门槛。

3、消费级RGB-D相机快速发展催生了以三维视觉为基础的商业化应用。以微软Kinect系列、Intel realsense系列、苹果、英飞凌、TI等为代表的消费级RGB-D相机逐渐形成成熟的产业链,国内也涌现出大量的优秀企业并量产,如orbbec、pico、human+、爱观、图漾、艾芯智能、知微传感等。此外,2017年iPhone X前置结构光深度相机面世后,更是激发了手机产业链RGB-D相机的热潮,目前华为、小米、OPPO、VIVO等手机大厂都在积极推动RGB-D相机在手机上的应用。

4、目前计算机视觉领域主要还是通过二维的图片来感知世界,而三维视觉才是人类感知理解世界的正确方式,因此以三维视觉为基础的SLAM技术是智能移动机器人、无人驾驶、AR等人工智能细分领域的核心技术。

目前对SLAM技术需求强烈的公司包括:互联网公司如百度、腾讯、阿里、京东等,计算机视觉算法公司如旷世、虹软、商汤等,自动驾驶创业公司如图森、momenta、景驰、驭势、滴滴及各大汽车厂商等,无人机/机器人公司如大疆、思岚、高仙等,AR移动终端应用相关公司如三星、华为、悉见等。

总之,SLAM前景光明但学习道路曲折,这也是笔者打算和读者一起从零开始学习SLAM的初衷。

从零开始一起学习SLAM系列规划

目前关于SLAM学习的资料不多,而且参差不齐,初学者推荐高翔博士的《视觉SLAM十四讲》,虽然本书写的已经比较基础,但很多小伙伴在学习期间仍然会遇到很多问题,因此,笔者《从零开始一起学习SLAM》系列文章规划如下:

1、技术介绍全面,不枯燥。该系列从最基础的知识开始介绍,分为多篇文章,每篇文章只介绍一个具体的知识点,尽量以形象生动的图文辅以适当的推导,一点点深挖SLAM的各个重要技术点。

2、每篇文章都有习题,重视实践。笔者会根据每篇文章内容设计一些实用性的练习题(推导、编程等),俗话说,光看不做假把式,适当的练习能够加深读者的理解,把知识消化吸收为自己所用。

3、高质量的交流学习社区。每篇文章练习题参考答案笔者会放到知识星球「从零开始一起学习SLAM」里。星球内所有成员都可以进行发布问题、分享知识、上传资源、点赞、留言、赞赏、收藏等操作。而所有的交流讨论、资源分享等都可以沉淀下来并方便日后查询。星主还会额外布置作业,和大家一起学习讨论。

知识星球需付费加入,越早加入价格越优惠。笔者还会不定期邀请SLAM领域的大牛加入星球坐镇。此外,星球还会红包奖励积极分享、解答问题的成员,只要花费一顿聚餐的钱,就能够和一群优秀的SLAM从业者一起交流进步,甚至解决就业问题。点击原文链接就能找到SLAM学习圈入圈方式。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • SLAM领域牛人、牛实验室、牛研究成果梳理

    版权声明:本文为博主原创文章,未经博主允许不得转载。违者必究。 https://blog.csdn.net/electech6/article...

    用户1150922
  • 从零开始一起学习SLAM | SLAM有什么用?

    SLAM是 Simultaneous Localization And Mapping的 英文首字母组合,一般翻译为:同时定位与建图、同时定位与地图构建。

    用户1150922
  • GPO:快速、准确地进行单眼SLAM初始化的全局平面优化

    初始化对于单目SLAM来说是必须的。本文重点研究了一种基于平面特征的单目SLAM初始化方法。该算法从滑动窗口的单应矩阵估计开始,然后通过全局平面优化(globa...

    用户1150922
  • SLAM领域牛人、牛实验室、牛研究成果梳理

    版权声明:本文为博主原创文章,未经博主允许不得转载。违者必究。 https://blog.csdn.net/electech6/article...

    用户1150922
  • 微信公众号应用开发流程 免费内网穿透映射本地,实现调试

    我们可以使用一系列内网穿透映射的工具,可以在公网访问本地开放的程序,(无论是自己搭建还是使用其他产品 都适用)

    宣言言言
  • 使用 PyCharm、Okteto 和 Kubernetes 搭建远程开发环境

    Okteto 是一个通过在 Kubernetes 中来开发和测试代码的应用程序开发工具。可以通过 Okteto 在 Kubernetes 中一键为我们启动一个开...

    我是阳明
  • 操作篇:Linux磁盘空间释放解决步骤

    IDC里的一台服务器的/分区使用率爆满了!已达到100%!经查看发现有个文件过大(80G),于是在跟有关同事确认后rm -f果断删除该文件。但是发现删除该文件后...

    小小科
  • 前端模块系统

    这是最原始的 JavaScript 文件加载方式,如果把每一个文件看做是一个模块,那么他们的接口通常是暴露在全局作用域下,也就是定义在 window 对象中,不...

    奋飛
  • 使用React.Suspense显示loading效果

    它必须返回一个 Promise,该 Promise 需要 resolve 一个 defalut export 的 React 组件。

    Qiang
  • 从 IP 开始,学习数字逻辑:FIFO 篇(上)

    使用 ip 对于数字逻辑方面的工作来说,是非常正常的,基础的 ip 之于数字逻辑设计,与与非门相比大概只是设计层次上的差别。更何况对于 SoC 公司来说...

    碎碎思

扫码关注云+社区

领取腾讯云代金券