NVIDIA新的人工智能技术:机器人观察人类行为,与人类共同完成任务

AiTechYun

编辑:chux

NVIDIA的研究人员开发了一个基于深度学习的系统,可以教导机器人通过观察人类的行为来完成任务。该方法旨在加强人与机器人之间的沟通,同时进一步研究将使人们能够与机器人无缝工作。

“对于机器人在真实环境中执行实用的任务,将任务传达给机器人一定很容易,这包括期望的结果和任何关于实现该结果的最佳方法提示,”研究人员在他们的研究报告中指出,“通过演示,用户可以将任务传达给机器人,并提供如何最好地执行任务的线索。”

使用NVIDIA TITAN X GPU,研究人员训练了一系列神经网络来感知,程序生成和程序执行相关的职责。结果机器人能够从现实世界的单个演示中学习任务。

方法如何工作:摄像机获取场景的实时视频,通过一对神经网络实时推断场景中对象的位置和关系。由此产生的知觉被送到另一个网络,将产生一个计划来解释重新创造这些知觉的方法。最后,执行网络读取计划并为机器人生成动作,同时考虑到当前现实的状态以确保不受外部干扰。

一旦机器人看到任务,它就会生成一个人类可读的重新执行任务必需的步骤描述。该描述允许用户在机器人上执行任务之前,快速识别和纠正机器人对人类演示的任何问题。

实现这种能力的关键是利用合成数据的力量来训练神经网络。目前训练神经网络的方法需要大量标记的训练数据,这也正是系统的瓶颈。通过合成数据生成,几乎可以无限制地生成几乎无限的有标记的训练数据。

这也是第一次在机器人上使用以图像为中心的域随机化方法。域随机化是一种产生大量多样性的合成数据的技术,然后让感知网络将真实世界的数据视为其训练数据的另一种变体。研究人员选择以图像为中心的方式处理数据,确保网络不依赖于摄像头或所处环境。

“我们所描述的感知网络适用于任何现实世界的物体,可以通过其3D边界长方体合理地近似估计,”研究人员表示。“尽管感知网络在训练过程中从未观察过真实图像,但在严重遮挡的情况下,它也可以可靠地检测真实图像中物体的边界长方体。”

该团队在几个彩色块和一辆玩具车上训练了物体探测器。系统学习了块的物理关系,即它们是堆叠在一起还是彼此相邻。

视频内容

在上面的视频中,人类操作员向机器人显示一对栈的立方体。然后系统会推断出一个合适的程序,并将立方体以正确顺序放置。因为它在执行过程中考虑到了当前的世界状况,系统能够实时从改正错误。

研究人员将在本周在澳大利亚布里斯班举行的机器人与自动化国际会议(ICRA)上发表他们的研究论文。

该团队表示,他们将继续探索使用合成训练数据进行机器人操纵,将其方法扩展到其他场景。

原文发布于微信公众号 - ATYUN订阅号(atyun_com)

原文发表时间:2018-05-21

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏携程技术中心

干货 | 京东JIMI用户未来意图预测技术揭秘

作者简介 邹波,京东JIMI核心算法架构师,致力于NLP领域和深度学习方向。目前负责用户未来意图预测,智能分流,会话结束预测等项目,极大的提高了客服工作效率,同...

5668
来自专栏QQ大数据团队的专栏

用户增长分析——用户流失预警

1 前言 针对用户增长分析这个课题,本文主要从用户防流失的角度,阐述如何基于QQ社交网络数据构建用户流失预警模型,找出高潜流失用户,用于定向开展运营激活,从而...

7.3K3
来自专栏数据派THU

独家|盘点5个TensorFlow和机器学习课程,程序员福利(附资源)

本文为你介绍5个有关TensorFlow的机器学习课程,来帮助你进一步了解数据科学和人工智能。

1854
来自专栏机器之心

学界 | 基于概率隐层模型的购物搭配推送:阿里巴巴提出新型用户偏好预测模型

4236
来自专栏ATYUN订阅号

fast.ai推出全新的7周实用深度学习课程

深度学习入门课程第1部分,为编码人员提供实用的深度学习入门课程,由Jeremy Howard (Enlitic创始人)授课。深度学习入门课程不需要研究生水平的数...

1024
来自专栏CSDN技术头条

【BDTC 2015】深度学习分论坛:DL的图像识别、语音识别应用进展

2015年12月10-12日,由中国计算机学会(CCF)主办,CCF大数据专家委员会承办,中国科学院计算技术研究所、北京中科天玑科技有限公司与CSDN共同协办,...

2279
来自专栏专知

论文被拒的原因……以及我们能做些什么

【导读】作为一位研究学者,或者硕博研究生,论文被拒简直是噩梦……你知道你的论文会因为什么原因被拒吗? 我们应该如何尽量提高自己文章的录取概率?这里有一份指南送给...

2292
来自专栏ATYUN订阅号

【学术】神经网络正在学习“记忆”和“忘记”

记忆是一种珍贵的资源,所以人类已经能够记忆重要的技能,忘记无关紧要的技能。现在机器也被设计成这样。 ? 深度学习正在改变我们使用和思考机器的方式。在各种任务中,...

2884
来自专栏智能算法

推荐算法概览

原文:Overview of Recommender Algorithms 作者: MAYA.HRISTAKEVA 译者: 孙薇 推荐算法概览(一) 为推...

4387
来自专栏腾讯云技术沙龙

王珺:智能音箱语音技术分享

这次分享介绍了在研究方面的一系列新的方法和改进,主要是语音识别,语音识别,声纹识别,以及TTS,在落地应用方面,语音识别中心为多个腾讯的产品有技术支持的输出,如...

8496

扫码关注云+社区

领取腾讯云代金券