前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >DeepMind 让计算“做梦”改善机器学习(附论文下载)

DeepMind 让计算“做梦”改善机器学习(附论文下载)

作者头像
新智元
发布2018-03-26 14:19:37
7060
发布2018-03-26 14:19:37
举报
文章被收录于专栏:新智元新智元

【新智元导读】在通用人工智能的研究上,DeepMind一直在努力。科幻小说家Philip Dick曾在他的经典小说中提到,机器人不太可能会做梦。但DeepMind最新研发出的人工智能系统却实现了机器人做梦,并且成功完成在迷宫中找到苹果的任务

DeepMind11月17日发表论文,其机器学习系统的速度和性能上实现了飞跃。最新的人工智能系统至少在比喻的意义上能够做梦。

科幻小说家Philip Dick曾在他的经典小说中提到,机器人不太可能会做梦。但Google旗下公司DeepMind最新研发出的人工智能系统却实现了机器人做梦,这款人工智能系统成功完成了在迷宫中找到苹果的任务。

DeepMind研究人员本周四发布的一篇文章中提到,这一成果使他们的机器学习系统在速度和性能上有了质的飞跃。系统成功嵌入了类似于动物做梦的功能属性。

新系统名为无监督式加强辅助学习机制(UnsupervisedReinforcement and Auxiliary Learning agent)或Unreal的新系统,能够很快学会三维迷宫游戏Labyrinth的玩法,速度比现在最高级的AI软件还要快10倍,其水平已经达到人类玩家的87%。 DeepMind研究人员还表示,该系统训练速度快、效率高,其数据有效性也很高。并且缩短了训练时间,可以更快地尝试新的玩法。

苹果迷宫

游戏采用DeepMind研发的游戏环境Labyrinth,设计采用的是非常有名的视频游戏系列Quake风格。游戏中的机器在迷宫中导航路线,收集路线上遇到的苹果得分。

这种类型的游戏是人工智能研究的重要领域,比如游戏中得分机率的设定。研究人员让Unreal在游戏中进行重复操作,集中记录下每次得分的点,这就跟动物做梦是一样的。

研究人员将Unreal的运行标准最大化,而不仅仅是得全分。其中一个必要标准就是视觉环境会随着不同的表现行为而发生改变,这是为了研究行为是怎样影响视觉的。这就跟新生儿学习控制外在环境获得回报是一样的,比如经常暴露在视觉冲击下,如闪亮、多彩的东西,他们就会表现出开心和兴趣。

研究团队中的Jaderberg andMnih在文章中也表示,将Unreal或其他类似的系统应用到实际中还为时尚早。

游戏冠军

从国际象棋到像美国Jeopardy那样的问答类竞赛,都在人工智能研究起到了程碑式的重要作用。DeepMind在今年早些时候研发的AlphaGo战胜了围棋世界冠军,成为人工智能领域的一大突破。公司还于月初发布了一款界面,将暴雪公司的科幻视频游戏“星际争霸II”应用到机器学习软件中。星际争霸将是AI研究未来重要的研究目标,因为游戏中的很多场景都非常接近“真实的世界混乱”。Oriol表示,Unreal将致力于提高这款游戏的性能。

游戏高手

DeepMind的Unreal系统还击败了公司现有的所有软件,在Atari公司的57款游戏(包括Breakout)的测试中,Unreal速度更快,得分更高。研究人员表示,Unreal在这些游戏中的表现成绩超过顶级人类玩家880%,而DeepMind原来研制的AI软件只超过了人类玩家的853%。

即使是Montezuma’sRevenge这样最复杂的Atari游戏中,新系统在性能表现方面也实现了更大的飞跃。他们表示,旧的AI系统在游戏中得分是0,而Unreal则获得了3000分的高分,足足比人类顶级玩家的最好成绩还要高出一半。

原文链接:https://www.bloomberg.com/news/articles/2016-11-17/google-deepmind-gives-computer-dreams-to-improve-learning

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2016-11-20,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 新智元 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档