高级搜索树+深度增强学习,Google DeepMind AI算法击败欧洲围棋冠军

纵横十九道,棋子无大小,平均150回合的比赛,最大有3^361 种局面(大致为10^170),围棋一直被视为人工智能(AI)的最大挑战之一,但Google旗下的DeepMind声称其AI算法已经掌握了比赛。

据Nature报道,DeepMind宣布其程序AlphaGo击败了欧洲围棋冠军樊麾,五战五胜,没有任何让子。

DeepMind引以为傲的是AlphaGo并非基于规则的程序,而是以机器学习算法取胜。据其解释,AlphaGo将高级搜索树与深度神经网络结合在一起。这些神经网络通过12个处理层传递对棋盘的描述,处理层则包含数百万个类似于神经的连接点。

AlphaGo包括两种神经网络来判断每种下子策略的优劣,其中“策略网络”(policy network)负责选择下一步走法,抛弃明显的“臭棋”减少搜索的宽度,重点分析好棋,“价值网络”(“value network)用来计算局面,抛弃某些路线。

DeepMind用人类围棋高手的3000万步围棋走法训练神经网络,同时,AlphaGo还通过增强学习(Reinforcement Learning)自行研究新战略,利用50台机器,在它的神经网络之间运行了数千局围棋,反复试验调整连接点。

在和其他围棋程序的对抗中,AlphaGo的胜率为99.8%(495局中只输一局)。2016年3月,AlphaGo还将在韩国首尔公开对决韩国围棋选手李世石九段。李世石是近10年来获得世界第一头衔最多的棋手,但DeepMind联合创始人Demis Hassabis表示对AlphaGo很有信心(We’re pretty confident)。届时,我们可以一睹最牛围棋AI的极限。

Nature报道:http://www.nature.com/news/google-ai-algorithm-masters-ancient-game-of-go-1.19234

Google博客:https://googleblog.blogspot.com/2016/01/alphago-machine-learning-game-go.html

原文发布于微信公众号 - 人工智能头条(AI_Thinker)

原文发表时间:2016-01-28

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏量子位

AI给植物看病,宾大用TensorFlow做的这款应用造福坦桑尼亚农民

25260
来自专栏绿巨人专栏

博弈论(Game Theory) - 01 - 前传之占优战略均衡

36380
来自专栏人工智能头条

2000块GPU训练一个围棋AI,Facebook告诉你什么叫“真的壕”

17440
来自专栏思影科技

AJP事件相关电位研究:减弱的奖赏神经反应可以前瞻性预测 青春期少女抑郁症的发展

来自纽约Stony Brook大学心理学、精神病学和行为学部门的Brady D. Nelson等人发现奖赏正波的降低可以预测十八个月之后抑郁症的首发情况和抑郁症...

29950
来自专栏灯塔大数据

Alphago获胜秘籍之武侠版【原创】

十年前,一个荒无人烟的荒岛上,走来了两个人。一个老者,一个少年。老者名叫深思,无所不知,但是却不会武功;少年名叫Alpha,是个孤儿,之所以叫这个名字,可能是...

33940
来自专栏机器学习AI算法工程

R语言构建追涨杀跌量化交易模型

作者:张丹(Conan), 程序员Java,R,Javascript 原文:http://blog.fens.me/finance-chase-sell/#c...

44880
来自专栏SIGAI学习与实践平台

永远的金大侠-人工智能的江湖

金庸先生已离我们远去,笔者当天在朋友圈看到这一消息时心情非常沉痛。作为在小学时就开始读金庸小说的80后,先生给我们的,不仅仅是一个个鲜活的人物,跌宕起伏的故事情...

9710
来自专栏华章科技

概率入门:双色球中奖、购车摇号中签和德扑同花顺,哪个更容易?

导读:排列组合是我们在这本书中接触到的第一个概率论概念,也是我们在高中学过的一个概率学的入门概念。概念记不清了也不要紧,我们回忆一下在中学学过的排列组合都有哪些...

22030
来自专栏WOLFRAM

Mathematica 谜中智 | 趣味象棋 一马平川

62030
来自专栏CDA数据分析师

逢赌必赢的秘密

本文由CDA作者库成员麻赛原创,并授权发布 原文来自公众号麻大湿讲数据(ID:madashi_data)。 ? 首先是麻大湿的老实交代 这篇文章标题党了,你不能...

56680

扫码关注云+社区

领取腾讯云代金券