麻省理工提出便捷的机器人学习方法

人工智能快报

发布于 2018-03-14 17:07:44

6800

发布于 2018-03-14 17:07:44

文章被收录于专栏：人工智能快报

美国麻省理工学院(MIT)网站发布消息称，该校已经提出了一种更便捷的机器人训练方法。

大多数机器人使用以下两种方法中的一种进行编程：从演示中学习，观察任务完成的过程并复制该过程，或通过运动规划技术学习（如优化或抽样）。后者需要由程序员明确指定任务的目标和限制。

上述两种方法都有缺陷。从演示中学习的机器人不能轻易地将已学到的技能用于另一种情况并保持准确。另一方面，使用采样或优化机制的运动规划系统可以适应这些变化，但耗时更长，因为它们通常需要由专业程序员人工进行编程。

麻省理工学院计算机科学与人工智能实验室（CSAIL）的研究人员最近开发了一个系统：C-LEARN，旨在将这两种技术结合起来。它允许非编码人员轻松地教会机器如何执行一系列任务，方式是告诉机器人一些操控物体的经验信息，然后再给机器人做一次任务演示。

重要的是，这使得用户能够教会机器人能自动转移到具有不同移动方式的其他机器人身上的技能。对于需要各种机器人执行相似任务的公司来说，这是节约时间和成本的关键措施。“这个方法将演示学习的直观性与运动规划算法的精确性结合起来，可以帮助机器人完成以前无法学习的新型任务，例如需要使用双臂的多步骤组合任务。”研究人员表示。

该团队在Optimus上对系统进行了测试。Optimus是一种新型的双臂机器人，专为处理炸弹而设计，能够执行开门、运输物体和从集装箱中提取物体等任务。在模拟中，他们展示了Optimus学会的技能可以无缝转移到该实验室设计的6尺高、400磅重的人形机器人Atlas。描述C-LEARN系统的论文最近已被电气电子工程师学会（IEEE）国际机器人与自动化国际会议(ICRA)接收，该会议于5月29日至6月3日在新加坡举行。

在使用C-LEARN系统时，用户首先向机器人提供一个知识库，包含了如何接触并获取具有不同限制的各种对象的信息。（C-LEARN中的C代表“限制”）例如，轮胎和方向盘具有相似的形状，但是要将它们安装在汽车上，机器人必须以不同方式调整手臂来移动它们。这个知识库就包含了机器人要完成这个任务所需的信息。

然后，操作员使用三维界面向机器人提供一次针对特定任务的演示，这种演示由被称为“关键帧”的相关时刻序列表示。通过将这些关键帧与知识库中的不同情况相匹配，机器人可以自动给出行动计划建议，由操作员根据需要采用或进行编辑。

“人们看到某件事如何完成，将其与已知世界相关联。我们的方法其实与人类的这种学习方式是非常类似的。”研究人员说，“我们不可能神奇地凭借一次演示就完成学习，因此我们会接受新信息，并将其与以前的环境知识相匹配。”

一个挑战是，可以从演示中学习到的现有限制不够准确，无法帮助机器人精确地操纵对象。为了克服这个问题，研究人员开发了由计算机辅助设计（CAD）程序支持的限制。这种限制可以告诉机器人它的手臂是否应该与正在互动的对象平行或垂直。

该团队还展示了机器人与人类合作时表现得更好。87.5％的时间，机器人能够顺利地自行执行任务，而如果有操作员帮助纠正机器人偶尔出现的的传感器不准确测量相关的微小错误，机器人能够在100％的时间里都顺利执行任务。

“拥有知识库的机器人非常普遍，但将其与演示学习结合在一起的情况则不常见。”美国密歇根大学（University of Michigan）研究人员表示，“这很有帮助，因为如果你一遍又一遍地处理相同的对象，你就不希望每个新任务都要从零开始训练机器人。”

该系统属于更大规模的研究，后者聚焦于让基于演示的学习方法具有更好的适应性。对于已经从演示中学会如何从管子中取出物体的机器人来说，如果途中存在一个障碍物，需要该机器人以不同方式移动手臂，它可能就做不到了。然而，用C-LEARN训练的机器人可以做到这一点，因为它不是学习一种特定的方式来执行该动作。“我们正在从直接模仿运动的方式转向尝试推断运动的原理，这对该领域是有好处的。”密歇根大学的研究人员说，“通过在运动计划器中使用这些已经学会的限制，我们可以使得系统比仅仅模拟演示过程的系统更加灵活。”

麻省理工学院的研究人员指出，可以证明先进的LfD方法在时间敏感的场景（如炸弹处理和灾害响应）中非常重要。目前用于这些场景的机器人是在单个关节组合运动的水平上远程操控的。另一位研究人员说：“像捡箱子这样简单的任务可能需要20-30分钟才能完成，这对某些紧急情况而言是非常关键的。”

C-LEARN还不能处理某些高级任务，如避免碰撞，或针对给定任务规划出不同的步骤顺序。但该团队充满了信心，融合了更多来自人类学习的经验会赋予机器人更广泛的物理能力。

“在现实世界中，对机器人进行传统编程困难又繁琐，还需要大量的专业知识。”研究人员说，“如果我们能像训练人类那样训练它们：给它们一些基本知识和一个演示，效率就会高得多。这是令人兴奋的一步，因为它可以训练机器人执行所需的多臂、多步骤复杂任务。”

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2017-06-16，如有侵权请联系 cloudcommunity@tencent.com 删除

其他

本文分享自人工智能快报微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

其他

登录后参与评论

0 条评论

热度

麻省理工提出便捷的机器人学习方法

麻省理工提出便捷的机器人学习方法

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐