前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >“钢铁侠”马斯克又放新技能:发起OpenAI新算法,让机器人通过VR学习新技能

“钢铁侠”马斯克又放新技能:发起OpenAI新算法,让机器人通过VR学习新技能

作者头像
BestSDK
发布2018-02-28 17:35:18
7300
发布2018-02-28 17:35:18
举报
文章被收录于专栏:BestSDKBestSDK

之前,我们报道了MIT的科学家用机器人“教育”其他机器人,这种方法简便快捷,无需编程,大大降低了训练门槛。现在,马斯克牵头投资的非盈利公司OpenAI,也提出了一种同样很简便的训练方法。

  这种新方法就是通过VR来训练机器人。

  OpenAI在一篇博文中介绍道:“我们已经开发了一种新的算法,人们通过在VR环境中演示,就可以教会机器人如何完成一项工作。”

  这种算法被被称为单次模仿学习算法(one-shot imitation learning)。

  它的特点在于,人可以通过VR向机器人传达指令。只要先由人在VR中演示一遍,它就可以学会完成某项具体任务的方法。

  机器人通过VR学习

  桌面上共有6个不同颜色的立方块,不管怎么摆放,最终机器人都会采用相同的顺序,摆成跟人类操作一样的结果。

  这个算法是怎么让机器人做到这一切的呢?

  据研究人员介绍,这种新算法是由两个神经网络支持的。

  一个是视觉网络(vision network)。研究人员用不同的光线、纹理和对象的组合,生成成千上万张模拟图像,然后利用这些模拟图像来训练视觉网络。

  另一个是模仿网络(imitation network),它可以观察展示的过程,分析每一个任务的目的,然后从另一个起始配置开始完成这个目的。

  那么,模仿网络是如何搞明白问题的呢?

  据介绍,模仿网络从几十个不同的任务中得到训练,每个任务又包括上千次演示。

  每次训练,模仿网络都可以观察到两个演示案例。第一次演示,模仿网络可以全方位仔细观摩,第二次只会被展示一次。

  然后,研究人员就会使用监督学习,让机器人预测演示者下一步会采取什么行动。显然,机器人必须要学习如何从第一次展示中,推测下一步的行动。

  这个算法已经成功地教会了机器人如何叠方块,但是OpenAI表示,这种技术还可以应用于其他任务。

  OpenAI的研究人员说,他们的目标是让机器人能够像人类一样学习。

  除了这个新算法之外,本周,OpenAI还推出了一个开源的机器人模拟器Roboschool。

  这款模拟器是基于增强学习研究平台OpenAI Gym而开发的,提供了十几个新的操作环境。用户可以在模拟环境中训练一个或多个机器人。

  早在2016年12月,OpenAI还推出了开源平台Universe,在这个平台上,用户可以使用游戏、网络浏览器和各种软件来训练人工智能。

  如今在AI的风潮之下,必定会有越来越多的算法或系统,让机器人学会各种不同的技能。机器人将变得越来越聪明的同时,也会降低训练的门槛,让更多的人可以参与进来,共同见证AI的成长。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2017-05-20,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 BestSDK 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档