MIT开发模型帮助机器人像人类一样进行导航

编译:chux

出品:ATYUN订阅号

当人们穿过人群达到最终目标时,通常可以安全地驾驶而不必过多考虑。他们可以从他人的行为中学习,并注意避免的任何障碍。而对于机器人,这种导航概念是一种挑战。

麻省理工学院的研究人员现在已经设计出一种方法来帮助机器人就像人类一样驾驶。他们新颖的运动规划模型让机器人通过探索环境,观察其他智能体以及利用它们在类似情况下学到的知识来确定如何达到目标。在IEEE / RSJ智能机器人和系统国际会议(IROS)上发表了一篇描述该模型的论文。

目前流行的运动规划算法将创建一个可能的决策树,分支出来直到找到良好的导航路径。例如,需要导航房间到达门的机器人将创建可能移动的逐步搜索树,然后考虑各种约束来执行到门的最佳路径。然而,一个缺点是这些算法很少学习:机器人无法利用有关他们或其他智能体之前在类似环境中如何行动的信息。

“就像在下棋时一样,这些决定分支出来,直到机器人找到一个好的导航方式。但是,与国际象棋选手不同,机器人在不了解他们的环境和其他代理人的情况下探索未来的样子,”共同作者,麻省理工学院计算机科学与人工智能实验室(CSAIL)研究员兼研究中心的Andrei Barbu表示,“经历同一群人的第一千次就像第一次一样复杂。它们总是在探索,很少观察,也从不使用过去发生过的事情。”

研究人员开发了一种模型,该模型将规划算法与神经网络相结合,学习识别可以产生最佳结果的路径,并利用这些知识指导机器人在环境中的运动。

在他们的论文“Deep sequential models for sampling-based planning”中,研究人员在两种情况下展示了他们模型的优势:在具有陷阱和狭窄通道的挑战性房间中导航,以及在避免与其他代理人碰撞的同时导航区域。一个有前途的实际应用程序正在帮助自动驾驶汽车导航交叉路口,他们必须在合并到交通之前快速评估其他人将要做的事情。研究人员目前正在通过Toyota-CSAIL联合研究中心进行此类应用。

“当人类与世界互动时,我们会看到一个我们之前与之互动的对象,或者我们以前曾经去过的某个地方,所以我们知道我们将如何行动,”CSAIL的博士生和论文的第一作者Yen-Ling Kuo表示。“这项工作背后的想法是在搜索领域增加一个机器学习模型,该模型从过去的经验中了解如何提高规划效率。”

Boris Katz是CSAIL的首席研究科学家和InfoLab Group的负责人,也是该论文的共同作者。

权衡探索和开发

传统的运动规划师通过快速扩展最终覆盖整个空间的决策树来探索环境。然后机器人查看树以找到到达目标的方式,例如一扇门。然而,研究人员的模型在探索世界和利用过去的知识之间进行权衡。

学习过程从几个例子开始。使用该模型的机器人通过几种方式进行训练以导航类似的环境。神经网络通过解释机器人周围的环境来学习使这些例子成功的原因,例如墙壁的形状,其他代理人的行为以及目标的特征。简而言之,该模型“得知当你被困在一个环境中,并且你看到一个门口时,通过门出去可能是一个好主意,”Barbu说。

该模型将早期方法的探索行为与此学习信息相结合。基础规划师名为RRT,由麻省理工学院教授Sertac Karaman和Emilio Frazzoli开发(它是广泛使用的运动规划算法的一种变体,称为快速探索随机树或RRT)。规划器创建一个搜索树,而神经网络镜像每个步骤,并对机器人应该下一步的位置进行概率预测。当网络以高可信度进行预测时,基于学习的信息,它引导机器人进入新的路径。如果网络没有很高的可信度,那么它就可以让机器人探索环境,就像传统的计划者一样。

例如,研究人员在称为“bug trap”的模拟中展示了该模型,其中2D机器人必须通过中央狭窄通道从内腔逃逸并到达周围较大房间的位置。通道两侧的盲目盟友可以让机器人卡住。在这个模拟中,机器人接受了一些如何逃避不同的陷阱的训练。当面对一个新陷阱时,它会识别陷阱的特征,逃脱,并继续在较大的房间中搜索其目标。神经网络帮助机器人找到陷阱的出口,识别死角,并让机器人感知周围环境,以便快速找到目标。

本文中的结果基于在一段时间后找到路径的机会,达到给定目标的路径的总长度以及路径的一致性。在这两种模拟中,研究人员的模型更快速地绘制了比传统规划者更短且更一致的路径。

使用多个智能体

在另一项实验中,研究人员在具有多个移动代理的导航环境中训练和测试了该模型,这对于自动驾驶汽车尤其是导航交叉路口和环形交叉路口是一种有用的测试。在模拟中,有几个特工围绕着一个障碍物。机器人代理必须成功导航其他代理,避免碰撞,并到达目标位置,例如环形交叉口的出口。

“像环形交叉路口这样的情况很难,因为他们需要推理其他人如何回应你的行为,然后你将如何回应他们的行为,接下来会做什么,等等,”Barbu表示,“你最终发现你的第一个动作是错误的,因为稍后它会导致可能的意外。你必须应对的汽车越多,这个问题就会越来越严重。”

结果表明,研究人员的模型可以捕获关于其他智能体(汽车)未来行为的足够信息,以便尽早切断过程,同时仍然在导航中做出正确的决定。这使计划更有效率。此外,他们只需要在几个只有几辆车的环形交叉口的例子上训练模型。“机器人制定的计划考虑到了其他车辆将会做什么,就像任何人一样,”Barbu说。

穿越十字路口或环形交叉路口是自动驾驶汽车面临的最具挑战性的场景之一。据研究人员称,这项工作可能有一天会让汽车了解人类的行为以及如何适应不同环境中的驾驶员。这是丰田与CSAIL联合研究中心工作的重点。

Barbu表示,“并不是每个人的行为方式都相同,但人们却非常刻板。有些人害羞,有些人很有侵略性。该模型很快意识到这一点,这就是它可以有效规划的原因。”

最近,研究人员一直将这项工作应用于机械手,这些机械手在不断变化的环境中接触物体时面临同样严峻的挑战。

论文:arxiv.org/abs/1810.00804

原文发布于微信公众号 - ATYUN订阅号(atyun_com)

原文发表时间:2018-10-09

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI科技大本营的专栏

深度学习在2017年的十大发展趋势及预测

在本篇文章中,作者对深度学习在接下来一年中的发展趋势作出了十条预测。本文作者在《2011年软件开发趋势和相关预言》的十条预言中,有六条是准确的。 ? 在之前的博...

31570
来自专栏AI科技评论

业界丨专访 Jeff Dean,谷歌战神谈增强学习和无监督学习

编者按:近日,谷歌大脑负责人 Jeff Dean 在接受 Fortune 杂志采访时讲述了他对无监督学习和增强学习在人工智能领域应用的看法,雷锋网进行编译。 下...

35240
来自专栏AI科技评论

开发 | Facebook 的“自然语言理解”如何让Messenger更懂人类?(6500字演讲全文)

AI科技评论按:Facebook的AML和FAIR团队合作进行自然语言处理对自然语言理解进行着合作研究。在2017年4月19日举办的F8开发者大会上,Faceb...

37090
来自专栏ATYUN订阅号

【学术】麻省理工学院的学生们愚弄了谷歌图像识别技术 计算机视觉算法仍然很容易被骗

人工智能图像识别技术已经取得了一些令人惊叹的进步,但正如一项新的研究表明的那样,这些系统仍然可以被那些愚弄的例子所绊倒。 一群麻省理工学院的学生最近愚弄了谷歌开...

30730
来自专栏数据科学与人工智能

机器学习与数据科学

计算技术通常用来分析数据,而理解数据则依赖于机器学习。多年来,对于大多数开发者来说,机器学习却是非常遥远、一直是难以企及的。 这可能是现在收益最高,也是最受欢...

276100
来自专栏AI研习社

Tensorflow框架平台的综合对比 | Tensorflow 最全资料汇总【3】

【AI研习社】关注AI前沿、开发技巧及技术教程等方面的内容。欢迎技术开发类文章、视频教程等内容投稿,邮件发送至:zhangxian@leiphone.com 作...

36980
来自专栏华章科技

Intel研究院院长吴甘沙:大数据分析师的卓越之道(珍藏版)

亲爱的各位同仁,各位同学,早上好。大数据时代数据分析师应该做什么改变?我今天的标题是大数据分析师的卓越之道。这个演讲信息量比较大,我讲的不一定对,即使对的我也不...

9120
来自专栏人工智能

机器学习 从入门到精通的学习方法

我将介绍5个“机器学习”的步骤,这五个步骤是非常规的。

1.1K110
来自专栏机器学习算法工程师

快手类推荐系统实践

1. 什么是推荐系统 推荐系统是一种信息过滤系统,近年来非常流行,应用于各行各业。 比如大家耳熟能详的快手、头条、手机百度、淘宝、京东、应用宝...几乎各个平台...

62550
来自专栏机器之心

深度 | 致开发者:2018 AI发展趋势

377110

扫码关注云+社区

领取腾讯云代金券