学界丨OpenAI发布“宇宙”平台,用1000+训练环境赋予AI以“类人智力”

在人工智能领域大牛在西班牙NIPS会议酒店吃早餐的时候,Open AI 宣布开源了其新平台“宇宙”(Universe)。这家由伊隆·马斯克资助的非赢利性AI开源组织,在周一的上午搞了个大新闻,相信NIPS的餐桌上一定热闹非凡。当然,Open AI后续也在NIPS的会场展示了自己的成果。

Open AI 联合创始人Greg Brockman 在Twitter上说道,“这个AI 训练架构,是我们从Open AI建立之初就在计划着的”。可见Open AI对这个平台的重视。

那么这个敢以“宇宙”命名的 Universe是个什么东西呢?

掌握人类的“普通智力”

OpenAI官网的介绍是:Universe软件平台,通过全世界的游戏、网页和其它应用,来测量和训练AI的普通智力。

在Universe上,AI智能体像人一样使用电脑:观看视频,并操作键盘和鼠标(只不过是虚拟的)。总而言是:人类可以在网络上做的事情,Universe都可以让AI智能体经历一遍,目的就是训练智能体掌握类似于人类的“普通智力”。

如今的AI技术,已经使计算机能看、能听和翻译,还能产生图像、声音和文本,AlphaGo甚至击败了李世石。

但是如今的AI技术仍然逃脱不了“窄AI”的范畴,也就是说,它可以在某一个特定领域达到超强表现,但是一旦超过这个领域,就无法工作。AlphaGo能在围棋上轻松赢过任何人,但是没法去玩其他的棋类游戏。

而Universe平台,就是为了打破“窄AI”的樊篱而诞生的。其核心架构由 Greg Brockman, Catherine Olsson和Alex Ray三人一起建构。

OpenAI创始人Ilya Sutskever在接受《连线》采访时说道:“一个AI智能体就是应该能够解决你扔给它的任何问题。”这听起来有点过于大胆了,甚至有点“天方夜谭”。但Sutskever将Universe与ImageNet作类比,他认为ImageNet帮助计算机能够像人一样地“看见”,如今谷歌和Facebook的众多app已经可以做到这一点了,而Universe要做的,就是将人工智能朝向每一个维度扩展。

1000+训练环境

早在今年4月,OpenAI 发布了一个名为Gym的工具包,用来开发和比较增强学习算法,包括了众多训练环境(Environments)。如今在Universe上,任何一个程序都可以转变成一个Gym环境。

今天发布的Universe,可以在1000多个环境里运行,包括Flash 游戏、浏览器任务等。Universe 搞定了 Valve 和 Microsoft这样的游戏巨头,获得了游戏授权。

(Universe平台的部分合作方)

其实在游戏里训练智能体不是新鲜事儿,因为游戏的内容是可控的,有清晰的奖惩机制,所以智能体在其中可以稳定地学习什么可以做,什么不可以做。比如加拿大阿尔伯塔大学提供了经典游戏Atari的学习环境,微软则基于Minecraft游戏打造了Malmo系统。

可以说,从训练智能体这一点来看,视频游戏已经给真实世界带来了积极的影响。

不过相比而言,Universe不仅可以在众多游戏环境里,还能在浏览器任务等任何网络环境里运行,其覆盖面超过了以往任何同类系统。

意义:省钱

DeepMind之前建立了一个可以在Atari游戏里训练的智能体,并使用相似的技术来对谷歌全球数据中心网络进行精细化训练,以此来节省每年数百万美金的成本支出。

Craig Quiter目前是Otto公司的工程师,这家自动驾驶卡车公司今年夏天被Uber收购。 在任职Otto之前,Quiter曾参与过Universe的开发工作,由于此前对该平台早已熟悉,他对 Universe“省钱”的功能兴致勃勃,正在打造一个可以玩“侠盗猎车手V”游戏的智能体。

目前Otto的自动驾驶系统可以在相对平稳的环境下运行,但是在未来几年,该公司希望可以随时对路上遭遇的恶劣状况做出反应,而“侠盗猎车手V”里此起彼伏的惊险车况,对于Otto的自动驾驶系统是个很好的训练素材。

Sutskever表示,在长期看来,Universe平台以后甚至可以用于“迁移学习”:智能体把一个场景中学到的东西应用到另一个场景。他表示目前已经在着手建立一些智能体,将一个赛车游戏里学到的东西,应用在新的游戏里。

原文发布于微信公众号 - AI科技评论(aitechtalk)

原文发表时间:2016-12-05

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏全栈数据化营销

数据分析:挖掘竞争对手和行业的广告投放方法和竞争策略

可能很多人随口都能说上几种,这也确实是数据的魅力和能力,这里不讲大家耳熟能详的,这次就讲讲数据在SEM营销推广中分析和认知竞争对手的内容:竞争对手都是怎么投放广...

26620
来自专栏用户3246163的专栏

[脑书笔记]《刻意练习》(中):在工作和生活中应用刻意练习!

美国在越战初期的空战水平是击落9架敌机,要损失10架战机;但是在越战后期可以达到结果12.5架敌机,才损失1架战机。帮助美军完成这个巨大改变的就是“王牌飞行计划...

15940
来自专栏AI科技大本营的专栏

解读|你并没看懂的 Google I/O 背后

今天谷歌用TPU、TPU Pods、TensorFlow Lite轰炸了媒体圈,可你知道谷歌宣称的TPU 180TFLOP并没有那么厉害吗?TPU Pods所对...

35590
来自专栏机器之心

从苹果店员到机器学习工程师:学习AI,我是这样起步的

我曾经在苹果商店工作,我想要改变,那么就从自己服务的技术入手吧。我开始学习机器学习和人工智能——这个领域非常热门,每一周,谷歌、Facebook 这样的科技公司...

8720
来自专栏CDA数据分析师

从苹果店员到机器学习工程师:学习AI,我是这样起步的

我曾经在苹果商店工作,我想要改变,那么就从自己服务的技术入手吧。我开始学习机器学习和人工智能——这个领域非常热门,每一周,谷歌、Facebook 这样的科技公司...

8620
来自专栏大数据文摘

阿尔法狗击败人类的背后:AI的发展仍存在哪些桎梏,我们又该如何应对?

18450
来自专栏量子位

昔日网瘾少年,现在用AI教你打守望先锋

也是在最近,身在旧金山的一群网瘾少年,走出了DOTA打到凌晨5点、星际打到凌晨3点的人生阶段,把他们对游戏的热情,释放到了一个教你打游戏的AI里边。

11040
来自专栏大数据文摘

DOTA2获胜的AI比AlphaGo厉害?还是媒体和马斯克在联合炒作?

15330
来自专栏数据科学与人工智能

【机器学习】机器学习人才发展全面指导手册(含学习路径和职业规划)

文 | 王俊宏 机器学习的学习路径 一、为什么是列出一堆可以探索的书,而不是要去寻找一条路 机器学习的研究和应用已经有很长的时间了。随着人类的发展,数据和计算能...

33080
来自专栏华章科技

院士李德毅:大数据认知(演讲全文)

2015年8月14日,由中国科协、中国科学院指导,中国人工智能学会发起主办的第五届中国智能产业高峰论坛在上海长荣桂冠酒店顺利召开。

8710

扫码关注云+社区

领取腾讯云代金券