【Science】机器人从单一演示中学习并相互传授技能,AI迈出统治世界第一步?

【新智元导读】Science报道,即将举行的 IEEE机器人与自动化国际会议上(IEEE-ICRA)有一项 MIT 的研究,提出了一个可从单一演示中学习多步骤操作任务,并在多个机器人中共享技能的系统——C-Learn。

不远的未来,机器人助理就会成为我们日常生活的一部分——但愿教它们新任务的时候不用非得编程。要是非得先学编程才能使用机器人,那这顿饭还是我自己做吧。现在,一个新系统让教机器人就像教孩子一样容易(也许不那么容易?)不过这回机器人统治论者又有了新口实,因为机器人可以用这个新系统互相之间分享技能了。训练机器人有两个基本方法。一个是为它的行动编程,这要求时间和编写代码的技能;另一个是把你想让它做的事演示给它看,摆弄它的实体或者移动它的数字表征都行,也可以做出样子来让它模仿。但一些任务的精确程度不是人类能轻松做出样子的——比如拆除炸弹引信之类的。

现在,用一个叫作 C-LEARN 的系统,科学家们赋予了机器人知识,这些知识表现为一些简单的步骤,在学习新任务时,机器人可以智能地应用这些知识。

“(C-LEARN)实用又有效。”并未参与本项研究的加州伯克利大学机器人专家 Anca Dragan 说。

C-LEARN 从单一演示中学习多步骤操作,并可实现机器人间的技能共享

在这个系统中,人类用户首先帮助构建机器人的知识库。研究人员通过在软件程序中点击并拖动其四肢,教导了一个名叫 Optimus 的双臂机器人。他们展示了诸如抓住圆柱体的顶部或块的侧面这样的动作,从不同的位置进行了七次任务。每次运动都有轻微的变化,机器人就会寻找模式,然后将其整合到系统中。例如,如果抓手总是最终大致平行于物体,则机器人将推断并行度是该过程的重要约束(constraint)。

在这一点上,机器人是“像一个2岁的宝宝,只是知道如何够到某个东西并抓住它。”研究负责人、MIT 计算机科学家 Claudia Pérez D'Arpino 说。凭借其知识库,机器人只需一次演示即可学习新的多步骤任务。用户使用 C-LEARN 软件向机器人展示所需的任务,然后批准或纠正机器人的尝试。非常简单易行。

没有参与本研究的西雅图华盛顿大学机器人专家 Maya Cakmak 说:“十多年前机器人就可以遵从几何约束了,然而,此前只有专家才能够使用它们。”

为了测试系统,研究人员教了Optimus 四个多步骤任务:拿起一个瓶子放在一个水桶里;用双手抓住并抬起一个托盘;用一只手打开一个盒子,然后用另一只手按下盒子中的一个按钮;用一只手抓住一个立方体上的把手,并用另一只手把一根杆子直拉出立方体。对于每个任务,Optimus 接受了一次演示,并进行了10 次尝试。 40 次尝试中,一共成功37 次,研究人员将于本月晚些时候在 ICRA 会议上进行报告。

为了增加挑战难度,研究人员将 Optimus 的知识库及其对四项任务的计划转移给了机器人Atlas ,Atlas 是个始终能保持平衡的双足机器人。Atlas 设法完成了四项任务。但是当研究人员删除掉一些转移的知识——例如保持某些移动平行的约束后,它失败了。

这种知识转移会有实际的应用价值。D'Arpino 说:“你能教一个德国工厂里的机器人做的事,没理由不能转移到加拿大的另一个机器人身上。”当然,那些认为未来一片黑暗的悲观主义者关心的是,通过互联网互相传递新技能将成为机器人统治世界的第一步。

D'Arpino 目前正在考察人类与 Optimus 的首次互动是否就可以教会它新的技巧。虽然还不能讨论过多细节,但迄今为止前景乐观。接下来,她希望教会机器人灵活地即时调整自己学到的技能。

最终目标之一是教会机器人拆弹,这个任务对精确性要求很高。机器人需要快速、高精度地引导。其他应用包括发现大灾中的人类、制造电子产品、帮助患病或懒惰的人做家务。“这是家居机器人的发展方向,但问题是现在它们什么都做不来。”D’Arpino说,“除了吸尘,现在的机器人还能给你做什么?这真的挺难的。”她希望能改变这个现状。

论文摘要

《C-LEARN:自动化分享中多步骤操作演示的几何约束学习》

C-LEARN:Learning Geometric Constraints from Demonstrations for Multi-Step Manipulation in Shared Autonomy

从演示中学习已被证明是非专家将操作性任务教给机器人的一种成功方法。这些方法通常从示范中构建生成模型,然后使用回归来重现技能。然而,这种方法对于捕获任务施加的硬性几何约束具有局限性。另一方面,虽然基于采样和优化的运动规划也将几何约束作为行动根据,但是这些操作通常是由专家精心手工制作的。为了解决这个技术差距,我们提出了 C-LEARN 系统。C-LEARN 是一种从演示中学习多步操作任务的方法,它将演示看作是一系列关键帧和一组几何约束。该系统构建了一个知识库,用于触达和抓取对象物体,然后利用该知识库从单一演示中学习多步骤任务。C-LEARN 支持具有多个终端执行器的多步骤任务;根据 SE(3) 体积分析和 CAD 约束——如需要保持两轴平行——来进行动作;并提供了一种方法,原则上可以在多个机器人之间转移学到的运动技能。我们将所学任务的执行嵌入到共享的自动化框架中,并通过分析使用双臂 Optimus 机器人执行物理任务的成功率来评估我们的方法,比较不同约束模型的贡献,并通过在模拟中使用腿式双臂Atlas机器人来执行学到的任务,展示出了 C-Learn 转移所学任务的能力。

链接:http://www.sciencemag.org/news/2017/05/look-out-robots-could-soon-teach-each-other-new-tricks

原文发布于微信公众号 - 新智元(AI_era)

原文发表时间:2017-05-12

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏PPV课数据科学社区

【学习】关于数据挖掘算法的反思

 写这篇文章,缘自于前几天部门内部成员们进行了一次部门内部现有涉及的一些算法的review以及整理。不过比较囧的就是,由于boss不在,我们讨论讨论着就成了吐槽...

3445
来自专栏大数据文摘

黄志敏:数据新闻制作7步法,一张图抵3万字

2685
来自专栏大数据文摘

机器真的已经战胜人类医生了吗?医学AI标题党文章中的三大陷阱

2077
来自专栏大数据挖掘DT机器学习

数据挖掘这些年,这些算法,这些反思

写这篇文章,缘自于前几天部门内部成员们进行了一次部门内部现有涉及的一些算法的review以及整理。不过比较囧的就是,由于boss不在,我们讨论讨论着就...

3156
来自专栏大数据文摘

立下新年flag之前 先看看如何用数据督促自己完成年度计划

1777
来自专栏IT派

推荐系统眼中的你:内容画像与用户画像

尽管推荐系统中应用了各种高深的算法、架构,但其基础原理是朴素的:更好的了解待推荐的内容、更好的了解要推荐给的人,从而更高效的完成内容与人之间的对接。断物识人,是...

6085
来自专栏数据科学与人工智能

【数据挖掘】这些年,这些挖掘机算法,这些反思

写这篇文章,缘自于前几天部门内部成员们进行了一次部门内部现有涉及的一些算法的review以及整理。不过比较囧的就是,由于boss不在,我们讨论讨论着就成了吐槽大...

2739
来自专栏PPV课数据科学社区

【案例】浅谈医学大数据是怎么回事?

编者按:本文作者陈遵秋,美国俄勒冈州,健康科技大学,公共卫生预防系,美国统计协会认证统计分析师;陈漪伊,美国俄勒冈州,健康科技大学,公共卫生预防系,生物统计助理...

3073
来自专栏数据派THU

送你10本机器学习和数据科学必读书(附PDF下载)

本文共1800字,建议阅读6分钟。 让一系列免费的机器学习与数据科学书籍开启你的夏日学习之旅吧!

4804
来自专栏大数据文摘

前沿 | MIT自动驾驶技术突破:实现浓雾中物体观测和测距,超人类水平

1316

扫码关注云+社区

领取腾讯云代金券