深度 | BAIR论文:通过“元学习”和“一次性学习”算法,让机器人快速掌握新技能

AI科技评论按:近日伯克利大学人工智能实验室(BAIR)Sergey Levine团队在Arxiv上发布了一篇名为《One-Shot Visual Imitation Learning via Meta-Learning》的论文,该论文将当前AI研究的两个瓶颈即元学习(Meta-Learning)和一次性学习(One-shot learning)相结合,并被CORL(Conference on Robot Learning, 2017)接收,CORL 2017将于今年11月在美国加州山景城举行。

我们都知道,深度学习是在大数据的背景下火起来的,传统的基于梯度的深度神经网络需要大量的数据学习,而绝大多数的深度学习内容否基于大数据量下的广泛迭代训练,当遇到新信息时往往会出现模型失效的情况从而需要重新进行学习。在机器人领域,深度神经网络可以是机器人展示出复杂的技能,但在实际应用中,一旦环境发生变化,从头学习技能并不可行。因此,如何让机器“一次性学习”,即在“看”了一次演示后无需事先了解新的环境场景,能在不同环境中重复工作尤为重要。

研究发现,具有增强记忆能力的架构如神经图灵机(NTMs)可以快速编码和见多新信息,从而起到消除常规模型的缺点。在本论文中,作者介绍了一种元-模拟学习(Meta-Imitation Learning,MIL)算法,使机器人可以更有效学习如何自我学习,从而在一次演示后即可学得新的技能。与之前的单次学习模拟方法不同的是,这一方法可以扩展到原始像素输入,并且需要用于学习新技能的训练数据明显减少。从在模拟平台和真实的机器人平台上的试验也表明了这一点。

目标:赋予机器人在只“看过”一次演示的情况下,学习与新物品互动的能力。

做法:

  • 收集大量任务的Demo;
  • 使用元-模拟学习进行训练;
  • 在未知的新任务中进行测试。

创新内容:在第一个全连接层通过偏差转换增加梯度表现。

模拟测试环节,这一环节使用算法提供的虚拟3D物品进行模拟,MIL比Contexual和LSTM更好地完成了任务。

在实际场景测试环节,该团队设计了一个抓取物品并将其放到指定容器中的任务。从上图我们可以看到,在这一环节用于训练的物品与实际测试的物品无论在形状、大小、纹理上都有着差别,MIL算法同样较好地完成了任务。

「AI科技评论」发现,除了BAIR,Google Deepmind(参见「AI科技评论」之前文章《只训练一次数据就能识别出物体,谷歌全新 AI 算法“单次学习”》)、OpenAI也有在进行关于“一次性学习”的研究。“一次性学习”通常被认为是计算机视觉中的对象分类问题,旨在从一个或仅少数几个训练图像中学习关于对象类别的信息,并且已经成功应用到包括计算机视觉和药物研发在内的具有高维数据的领域。今年5月,OpenAI也发布了类似的在虚拟场景下通过一次性学习,完成堆叠方块等任务的论文。

在《人类的由来》中,达尔文这样写道:“人和其他高等动物在精神上的差异虽然很大,但这种差别肯定只是程度上、而非种类上的差别。”而这些在一次性学习和元学习上的研究也证明,当前的人工智能与未来世界的超级人工智能之间的差异,或许也只是程度上的差异,而非种类上的差异。在深度学习发展的过程中,类似的优化看起来只是一小步,但加速化发展的趋势已经很明显:当你在阅读传统期刊上的论文时,在Arxiv上或许已经出现了新的替代版本。或许在不久之后,创造出更聪明、具有适应力的实用机器人并不是难事。

论文地址:https://arxiv.org/pdf/1709.04905.pdf

视频演示及更多详细说明:https://sites.google.com/view/one-shot-imitation

原文发布于微信公众号 - AI科技评论(aitechtalk)

原文发表时间:2017-09-20

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI科技评论

视频 | 10分钟带你认识强化学习

AI 科技评论按:喜欢机器学习和人工智能,却发现埋头苦练枯燥乏味还杀时间?油管频道 Arxiv Insights 每周精选,从技术视角出发,带你轻松深度学习。

1155
来自专栏机器之心

学界 | Yoshua Bengio等人提出MILABOT:强化学习聊天机器人

选自arXiv 作者:Iulian V. Serban等 机器之心编译 参与:路雪、李泽南 The Alexa Prize 是亚马逊在对话人工智能领域中发起的一...

2679
来自专栏计算机视觉战队

深度学习的昨天、今天和明天

机器学习是人工智能领域的一个重要学科。 自从20世纪80年代以来, 机器学习在算法、理论和应用等方面都获得巨大成功。2006年以来, 机器学习领域中一个叫“ 深...

3234
来自专栏机器之心

学界 | 启发式搜索:华为提出通用人工智能工程方法

选自arXiv 作者:Zengkun Li 机器之心编译 参与:刘晓坤、李泽南 鉴于当前认知神经科学和人工智能工程所遇到的困难,华为 2012 实验室的研究人员...

2765
来自专栏机器人网

机器人视觉与计算机视觉:有什么不同?

机器人视觉、计算机视觉、图像处理、机器视觉和图形识别,这几者之间到底有神马区别呢? 要弄清楚他们哪一个是哪一个,有时候也真的是容易混淆的。接下来看看这些术语的...

2804
来自专栏AI科技评论

解读 | “数据为王”是真的吗?谷歌轻抚着100倍的数据量点了点头

AI 科技评论按:过去十年里,研究人员在计算视觉领域取得了巨大的成功,而这其中,深度学习模型在机器感知任务中的应用功不可没。此外,2012 年以来,由于深度学习...

3196
来自专栏大数据文摘

被眼睛欺骗?这正是你比机器高明的地方!深度学习如何处理认知错觉

1413
来自专栏AI科技评论

深度 | 图普科技工程师:Mask R-CNN的理论创新会带来怎样的可能性?

melmcgowan 上周,AI 科技评论报道了 Facebook 实验室出炉的新论文《Mask R-CNN》,第一作者何恺明带领团队提出了一种名为「Mask ...

2695
来自专栏机器之心

CVPR 2017 李飞飞总结 8 年 ImageNet 历史,宣布挑战赛最终归于 Kaggle

机器之心报道 参与:机器之心编辑部 2017 年 7 月 18 日,ImageNet 最后一届挑战赛成绩已经公布,多个国内院校和企业在各个比赛项目上取得了非常不...

3025
来自专栏人工智能头条

AI变身记:不光能有人的智能,还要像狗一样“思考”

1254

扫码关注云+社区