首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【重磅】RSS2016 深度学习机器人领域最新应用及趋势总结(PPT下载)

【重磅】RSS2016 深度学习机器人领域最新应用及趋势总结(PPT下载)

作者头像
新智元
发布2018-03-22 18:00:05
8460
发布2018-03-22 18:00:05
举报
文章被收录于专栏:新智元新智元

【新智元导读】虽然在计算机视觉方面取得巨大突破,但深度学习(DL)在机器人领域尚未成为主流。由于在特定情境下无法确保机器人做出规定动作等原因,机器人领域还有很多“DL怀疑论者”。6月,国际机器人顶尖会议RSS2016举办了一场“DL怀疑论者”研讨会。本文为参会笔记,新智元结合讲者PPT整理,来自学界和产业界的机器人技术、DL和计算机视觉专家,共同探讨了DL在机器人应用中的局限和潜力。

过去3年,深度学习在计算机视觉领域取得了巨大成功。其中,在物体识别和检测、场景分类、根据图像生成文字描述等领域表现尤为突出。不过,深度学习在机器人视觉领域的表现还相形见绌。

虽然深度学习在机器人根据视觉引导进行抓取和控制方面得到了很好的应用,但目前还没有在机器人领域成为主流。而且,在去年的RSS、ICRA等重大国际机器人会议上,很多著名的研究者对深度学习技术在机器人场景中的应用能力公开提出了质疑。

因此,本届RSS 2016,主办方特地举办了一场小型研讨会,探讨深度学习在机器人技术中的应用及局限(Are the Sceptics Right? Limits and Potentials of Deep Learning in Robotics)。虽然只是一个小型研讨会(workshop),但主办方也邀请到机器人技术、深度学习和计算机视觉领域三方面的专家。其中,有的是在深度学习技术出现后很快就将其应用于自己在机器人技术相关领域,也有著名的“深度学习怀疑论者”。

下文作者是伦敦帝国理工大学戴森机器人实验室博士生John McCormac。McCormac的导师Andrew Davison是伦敦帝国理工大学计算机系主任,领导该校机器人视觉研究小组,同时也是戴森机器人实验室的负责人。McCormac的研究方向是使用深度学习进行三维语义分割和场景理解。

文中提到的讲者身份如下,黑色加粗表示演讲PPT可下载

请在新智元后台回复“06290X”下载相应PPT

  • North C科技公司CEO Larry Jackel,康奈尔毕业,曾任职贝尔实验室和DARPA)
  • MIT机械工程系主任John Leonard,该校AI实验室CSAIL成员
  • 华盛顿大学计算机科学与工程系主任Dieter Fox,演讲题目“Deep Learning for tracking and intuitive Physics”
  • 柏林工业大学Oliver Brock,演讲题目“What Is There to Be Skeptical About?”,062901
  • 加州大学伯克利分校副教授Pieter Abbeel,该校AI实验室BAIR成员,演讲题目“Deep Learning for Robotics”,062902
  • 圣母大学计算机工程与科学副教授Walter Scheirer
  • 谷歌DeepMind团队Raia Hadsell,演讲题目“Progressive Nets for Simulation to Robot Transfer”,062903
  • 康奈尔大学和斯坦福大学副教授Ashutosh Saxena,微软研究员,演讲题目“Learning and Sharing Knowledge for Robots”,062904

怀疑论者都在哪里??

(文/John McCormac)总体来说,这是个非常有趣的研讨会,但包括我在内的不少人都问,“深度学习怀疑论者都在哪里?”

最后,Pieter Abbeel直接问“谁是深度学习怀疑论者”,现场参加讨论的150到200多人中,包括听众和讲者,只有大约5到10人举起了手。而且,这些怀疑论者在被问道时,还都对深度学习表示了肯定,认为这种技术是研究机器人的重要工具之一。

让人对深度学习产生怀疑的大致有两点:一是在一些特定情境下无法确保做出规定动作,二则是深度学习在很多方面缺乏可解释的不确定性测量手段。

Larry Jackel提出了衡量一个人是否是“深度学习怀疑论者”的标准:按正常情况预计,未来10年自己会不会使用神经网络。如果你的答案是“不会”,那么你就属于深度学习怀疑论者阵营。

在Oliver Brock逼问之下,Pieter给出了一个更宽泛的解释,称深度学习提供了一个工具包,机器人技术研究者有望利用这个工具包实现更通用的智能机器人。有人表示如今对深度学习热潮有可能是寒冬降临前的爆发,但Pieter认为这不大可能发生,鉴于很多大公司已经使用深度学习盈利,比如谷歌的广告系统。

与会者普遍对深度学习采取实用的态度:机器人技术研究者要做的,是提出先验约束和模型约束,而深度学习则是之后再去解决这些约束造成的问题。

Oliver Brock将机器人技术里的深度学习现状和炼金术相比,每个人都有自己设计架构的黑魔法,而这是一个值得全领域从业者注意的问题。Brock呼吁要建立起机器人技术的“元素周期表”,研究者应该注意并且在论文中强调自己使用的方法对解决其他领域问题的适用性。

Ashutosh Saxena的观点是,机器人应用场景中的深度学习问题就像一个因子图,每个因子都是一个经过训练的RNN。Saxena认为,形成这样一个主因子图结构,同一个机器人不同时间的子任务和不同机器人之间就都能共享组件。

Dieter Fox主张将深度框架和先验模型相结合。Fox表示他以前对深度学习抱有怀疑,但如今已经是深度学习的积极拥护者,其原因是深度学习技术在机械手的姿态估计中的鲁棒性。Fox表示,纯粹基于模型的方法虽然能得到明确的置信区间,但在实际应用中很难达到这一点。他以ICP要求为例,至少用CNN做单帧手势跟踪鲁棒性非常好。

John Leonard 一开始说自己是深度学习怀疑论者,但5个月前他看到了Larry Jackel做的英伟达自动驾驶有关项目,然后改变态度,认为“让那些不用深度学习的人自生自灭就好了”。Jackel使用的是特斯拉收集的数据,包含摄像头和传感器记录的上亿英里的驾驶训练数据。Leonard还介绍了深度学习在机器人传统概率推理中的应用及未来潜力。

训练数据都从哪里来??

很多讲者都提到了训练数据的问题。Pieter Abbeel强调了OpenAI Gym平台可以用于解决合成强化学习机器人问题。

很多人都采用这样的方法:先在合成数据库上做试验,之后再使用现实世界数据进行更复杂的模拟。

谷歌DeepMind的Raia Hadsell在演讲中提到了PNN非常适用于这一过程。最先是训练系统玩ATARI游戏,然后发展成模拟的三维机械臂控制问题,结果发现使用了预先训练过的PNN框架的系统学得更快、性能更好。

Dieter Fox的实验室也采取了类似的方法。他们为流体模拟时,先使用混合的流体模拟,然后再使用现实世界的数据。

尚待解决的DL问题

一个经常提到的问题是如何将训练后的深度学习系统整合进应用于现实世界的机器人产品,不论是家用机器人还是自动驾驶汽车。绝大部分讲者认为,将测试中的每一个可能情形列举出来是不可能的,因此必须设定一些标准的故障容差数据集。Scheirer将容差与工厂里依靠统计模型进行测试作类比。Nicholas Roy则认为基于模型的方法更好。

Walter Scheirer从数据的角度讨论了CNN鲁棒性低的问题。CNN显然适用于单个图像分类任务,但鲁棒性低有时候确实是个问题。Scheirer借用心理物理学(Psychophysics)评价神经网络的方式,测试识别模糊图像和遮挡问题。结果得到了很多性能一流的网络,结果分辨率用人眼看也没有什么显著降低。因此,Scheirer指出,CNN在图像识别方面性能“超人”,但应用起来表现不好,实际上是参数没有设置好,导致算法鲁棒性评估出了问题。

在讨论中还出现了很多有趣的问答。有人问我们用人类使用的数据训练机器,这样的机器是否能够拥有超过人的能力,Oliver Brock回答说“AlphaGo”。另一个则是研究中在线训练时间的问题,有人问网络线下训练的权重是否重要时,Raia 回答说“是”。不过她之后具体阐述了这个问题,也是谷歌DeepMind在强化学习研究中的核心问题。

总结

最后,Pieter说相比以前,人脑也没有得到很明显的进化,但除了吃喝,我们还从中“得出”了很多充满智慧的发展。这也表明深度学习在机器人领域还仅仅处于起步阶段,而将来深度学习在机器人领域中的应用对发展通用人工智能大有助益。


本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2016-06-29,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 新智元 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
腾讯云小微
腾讯云小微,是一套腾讯云的智能服务系统,也是一个智能服务开放平台,接入小微的硬件可以快速具备听觉和视觉感知能力,帮助智能硬件厂商实现语音人机互动和音视频服务能力。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档