机器人模仿人类动作一学就会,还能举一反三了 | 论文

夏乙 发自 凹非寺 量子位 出品 | 公众号 QbitAI

你在椅子上坐下、夹起一筷子毛肚、送进沸腾的红汤里、等待8秒、夹出来……动作行云流水一气呵成。人类掌握吃火锅的技能,离不开有意无意的模仿。

不过,吃火锅对于机器人来说,就要难得多。想学会这一系列的动作,往往需要为它们设定复杂的目标和奖励函数。

好消息是,教它们通过模仿来学习的研究又有新进展,机器人更聪明更灵活了。

加州大学伯克利分校的科学家们在最新论文中提出了域自适应的元学习(Domain-Adaptive Meta-Learning),让机器人在看视频模仿人类行为时,能适应domain shift。也就是说,即使机器人的视角、环境、自身形体和视频中的人类有本质不同,它也一样能通过看一段视频快速学会其中的人类行为。

比如上面视频1分07秒的放置物体实验中,机器人面前盘子的摆放,与人类演示视频不同。但右下角用最新方法训练的机器人,还是迅速找到了正确的位置。

这项研究中展示的行为,当然没有吃火锅那么复杂,除了刚刚说过的在容器中放置物体,主要还包括推动物体、拿起物体再放到某处等等。

放置物体
推动物体
拿起物体再放到某处

不过,凭一段视频就能学会,还能举一反三?也可以说是相当厉害了。

作为一名接受教育十几年、学习了不少知识的人类,量子位相信你应该能够猜到:要具备这样的能力,得有充足坚实的基础知识储备。

伯克利的这项研究正是如此。在最关键的一段视频之前,科学家们会先用各种任务的大量视频来训练算法,帮机器人建立“先验知识”,这个过程就称为“元学习”。这时所用到的任务视频有人类的,也有机器人的。

有了先验知识之后,再结合某项任务的人类演示视频,机器人就能学着完成这项任务。

为了证明这种方法的有效性,他们用了两种7个自由度(DoF)的机械臂来做实验,一种是PR2,另一种是Sawyer。

实验显示,使用暂时损失(temporal loss)的Domain-Adaptive Meta-Learning在PR2机械臂看一次视频模仿各类行为的试验中取得了最高的成功率。

使用Sawyer机械臂,则是为了实验用kinesthetic teaching来记录机器人演示的情况。

虽然这项研究一直在让机器人模仿人类,但是几位科学家在论文中说,这种方法并不是专门用来感知人类动作的,也可以用来模仿动物,或者让真实世界中的实体机器人模拟虚拟机器人。

最后,感兴趣(致力于让机器人帮你涮火锅)的同学请看论文:

One-Shot Imitation from Observing Humans via Domain-Adaptive Meta-Learning Tianhe Yu, Chelsea Finn, Annie Xie, Sudeep Dasari, Tianhao Zhang, Pieter Abbeel, Sergey Levine https://arxiv.org/abs/1802.01557

原文发布于微信公众号 - 量子位(QbitAI)

原文发表时间:2018-02-07

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏量子位

“寓教于乐”,DeepMind新研究让机器人从0开始学习复杂精细动作

? 别小看这个笨拙地抓起、移动着物体的机器人,它可是DeepMind的最新研究成果。 有什么特别之处呢?这个机械臂可是在现实世界中直接训练的,没有搞现在模拟器...

32840
来自专栏AI研习社

Lucid Robotics 创始人:我是怎么启动AI创业项目的?

我们正处在一个AI大革命的开端,每周都有新的创新出现。例如 Tetra 利用语音识别技术,从你的手机中生成详细的笔记;Hyper Science 通过利用 OC...

12320
来自专栏人工智能头条

知人知面需知心——论人工智能技术在推荐系统中的应用

24050
来自专栏SIGAI学习与实践平台

【AI就业面面观】如何选择适合自己的舞台? --写给即将参加校招的学弟学妹们

一年一度的校园招聘即将开始,各位学弟学妹们将面临继高考、读研/博之后的又一次重大的人生选择。第一份工作对于一个人职业生涯的一生都至关重要,如何选择适合自己的团队...

11540
来自专栏数据科学与人工智能

【机器学习】机器学习正在五个方面重塑我们的世界

机器学习的技术越来越成熟,与大数据结合在一起为我们的世界带来了巨大的变化。对此,大数据专家Bernard Marr总结了机器学习在听、说、读、写、看五个方面如何...

24880
来自专栏AI科技评论

贾佳亚加盟腾讯优图后首次公开亮相:计算机视觉有哪三种打开方式?

腾讯优图实验室杰出科学家贾佳亚,香港中文大学计算机科学工程系终身教授,于 2017 年 5 月 15 日公布消息,全职加入腾讯优图实验室,负责计算机视觉、图像处...

34950
来自专栏人工智能头条

【BDTC 2015】百度、FreeWheel、新浪微博、京东和猎聘推荐系统架构和实现(视频+PPT下载)

22950
来自专栏专知

剑桥大学计算机系博士孙琳:自然语言处理(NLP)的发展以及在教育领域的应用情况(附报告pdf下载)

? ? 大家好!我是孙琳,很高兴参加TAB教育科技论坛,今天分享的题目是“教育应用中的自然语言处理”。首先我先做一下自我介绍,我是剑桥大学计算机系的博士,博士...

66850
来自专栏吉浦迅科技

Google TPU云可能会与英伟达合作

英伟达首席执行官黄仁勋坚持认为,用于训练机器学习模型的开发工具的处理能力和云计算能力,使得人工智能在计算平台和数据框架中无处不在。黄预测说,这场人工智能革命的一...

365110
来自专栏新智元

【CCCF动态】计算机网络顶级会议趋势分析

概况 SIGCOMM(ACM Special Interest Group on Data Communications,ACM数据通信专业组)、MobiCom...

54450

扫码关注云+社区

领取腾讯云代金券