深度学习新算法,像训练狗一样训练机器人?

美国陆军研究实验室(ARL)和德克萨斯大学(UT)奥斯汀分校的研究人员已经开发了新的机器人或计算机程序技术,以学习如何通过与人类指导员进行交互来执行任务。这项研究的结果于2月2日至7日在路易斯安那州新奥尔良的人工智能促进协会论坛上公布。

ARL和UT研究人员考虑了一个特定的情况,即人以评论的形式提供实时反馈。奥斯汀得克萨斯大学的合作者Peter Stone博士和他的前博士生Brad Knox首先研发的TAMER,或者通过评估强化手动培训机器人人,由ARL/UT团队开发了一种新的算法叫Deep TAMER。

这是TAMER的扩展,采用深度学习,它的灵感来源于人类的大脑,让机器人可以获得通过短时间观看视频来获得执行任务的能力。

据军方研究员Garrett Warnell博士表示,研究小组认为,一个人通过观察和提供评论(例如,“好工作”或“糟糕的工作”)来教导机器人如何做事,就像人类训练狗去变戏法一样。Warnell说,研究人员延伸了这个领域的早期工作,使这种类型的机器人或计算机程序的培训,通过图像看世界,这是设计可以在现实世界中运行的学习代理的重要第一步。

目前人工智能中的许多技术要求机器人在较长的时间内与环境进行交互,以学习如何最佳地执行任务。在这个过程中,机器人人可能会执行一些不仅可能是错误的行为,例如机器人在墙上跑步,而且可能会发生像机器人跳下悬崖等灾难性的事故。Warnell表示,来自人类的帮助将加快机器人的成长速度,并帮助他们避免潜在的陷阱。

作为第一步,研究人员展示了Deep TAMER的成功,通过15分钟的人为反馈来训练代理人在Atari保龄球游戏中比人类更好的表现,这个任务对于即使是最先进的人工智能方法而言也是非常困难的。Deep-TAMER训练的机器人展示出了过人的表现,甚至优于他们的业余训练师以及专家级人类Atari玩家。

左:ARL的研究员Garrett Warnell博士,右:德克萨斯大学(UT)奥斯汀分校教授Peter Stone博士

在未来一到两年中,研究人员有兴趣探索他们的最新技术在更广泛的环境中的适用性:例如除了Atari Bowling以外的视频游戏和更多的仿真环境,为真实世界中的机器人找到更好类型的代理和环境。

Warnell表示,“未来的军队将由士兵和自主队友并肩作战,尽管人类和自主机器人都可以提前接受培训,但他们有可能在完全陌生的新环境中执行搜索、营救或监视等任务,在这种情况下,人类可以很好地利用训练随机应变,而现在的人工智能机器人还做不到。”

Deep TAMER是研究人员设想的一系列研究的第一步,将使陆军中更加成功的人类-自主机器人团队成为可能。最终,他们需要自主的机器人人,能够以各种各样的形式,如演示、自然语言指导和评论,快速而安全地从他们的人类队友学习。

原文发布于微信公众号 - 机器人网(robot_globalsources)

原文发表时间:2018-02-08

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏大数据文摘

2016年10个重要的可视化发展

16130
来自专栏钱塘大数据

【精读】十分钟读完《智能时代》—吴军

“曾经,我们要学习如何操纵机器,掌握机器的语言,向机器靠拢;今天,机器在向人靠拢,试图理解人类、用我们的语言与我们对话。这就是“智能时代”,这个时代的基础是数据...

39690
来自专栏LET

技术 产品 团队(上):如何成为超级个体

20960
来自专栏钱塘大数据

【精读】十分钟读完《决战大数据》

推荐语: 每品觉在大数据应用领域有着丰富的经验,《决战大数据》一书中提出的观点对大数据的决策者很有意义。大数据使企业经营者拥有了“望远镜”“显微镜”,除了能对...

48950
来自专栏华章科技

【斯坦福AI百年报告2017】重磅发布人工智能与机器学习全景式概览

“AI Index”(AI指数)是斯坦福大学AI百年研究的一个项目,它是一个开放的非营利性项目,旨在追踪人工智能的活动和进展。它的目的是促进以数据为基础的对AI...

9620
来自专栏大数据文摘

DOTA2获胜的AI比AlphaGo厉害?还是媒体和马斯克在联合炒作?

14930
来自专栏企鹅号快讯

看机器学习和商业智能如何改善医疗保健的

商业智能概念,如描述性,诊断性,预测性和规范性分析,听起来像医学术语,实际上可以用于挽救生命的医疗保健方式。 在以患者和以人为中心的医疗保健领域,我们对机器学习...

28280
来自专栏PPV课数据科学社区

人工智能与医学(1):基于大数据的智能医学知识学习

作者:枫叶松木木 本人年轻时爱下围棋,记得上中学、大学时常跟好朋友们手谈。后来,越来越忙了,一是没有时间了,二是手谈的朋友们也很少相聚了,就很少下围棋了。于是,...

47670
来自专栏机器之心

观点 | 人工智能搁浅了?听一听纽约大学教授Gary Marcus怎么说

选自New York Times 作者:Gray Marcus 机器之心编译 参与:路雪、黄小天 近日,Gary Marcus 在纽约时报上发表了一篇题为《Ar...

380100
来自专栏AI科技大本营的专栏

定义AI,麦卡锡、图灵、乔丹...我们听谁的?

【AI科技大本营导读】关于如何定义人工智能我们似乎从来没有达成一致。一种观点是,机器现在还没有理解、推理能力,距离真正的人工智能相去甚远,人们只是在炒作一个看上...

12030

扫码关注云+社区

领取腾讯云代金券