前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Alphago获胜秘籍之武侠版【原创】

Alphago获胜秘籍之武侠版【原创】

作者头像
灯塔大数据
发布2018-04-09 17:16:12
6140
发布2018-04-09 17:16:12
举报

十年前,一个荒无人烟的荒岛上,走来了两个人。一个老者,一个少年。老者名叫深思,无所不知,但是却不会武功;少年名叫Alpha,是个孤儿,之所以叫这个名字,可能是当初父亲从拉丁字母表的随便挑的。少年Alpha武功资质一般,但是有一项特殊的天赋,反应快,远超常人。

深思带Alpha到这个荒岛来,目的只有一个,就是将Alpha培养成为绝世高手。

一老一少不紧不慢的走了一天,来到了一个山洞。老者面无表情,对少年只说了一句:“自己学,三年之后出来见我。”然后头也不回的走了。

少年进了山洞,发现里面竟是一个藏经阁,里面收藏了古今以来所有的武林秘籍。少年大喜,开始日夜不停的开始学习。

五年后,少年离开了山洞,老者等在外面。五年的时间,少年从一无所知,仅仅靠自学,已经具备了差不多黄蓉(参见《射雕英雄传》)的实力,当然终究是纸上谈兵,武功无法再进一步。

深思只是简单的告诉少年,你可以到江湖上历练了。

不过,在把少年仍到江湖上去拼杀之前,深思交给了Alpha一件兵器,或者说是一件神器。这个神器的作用的用法很简单,可以召唤出一万个分身,但是这些分身只会武功,没有内力。在对阵的时候,这件神器不能直接对阵搏杀,但是它可以模拟Alpha和对手的过招,从一万次模拟过招中发现对手的破绽,然后一招制敌。

深思对Alpha说,以后,你就叫Alphago吧,于是,Alphago横空出世,依靠分身神兵,实力竟然达到了丘处机的水平。

Alphago的崛起是如此之快,江湖高手们很快就开始重视这个突然冒出的高手,并开始研究Alphago的弱点。很快,他们发现了Alphago一个最大的弱点,招法超强内力不行。这个限制导致了Alphago无法再进一步,成为顶尖高手。

这个时候,深思出现了,他将Alphago带回了山洞,并交给他一个新的修炼方法:左右互搏。于是Alphago开始闭关,在闭关期间,他利用左右互搏之术,每天自己互击上万次,在经过了上千万次的左右互搏练习后,Alphago出关了。

这个时候的Alphago,内力上有了飞跃,不靠分身神兵,自身就达到了丘处机的水平。而依靠分身神兵,Alphago几乎就是加强版的欧阳锋,有实力挑战这个世界的顶尖高手了。

剩下的事情,你们都知道了:华山论剑让Alphago一战成名,傲视天下!

更专业一点的解释:

“山洞自学”其实就是深度学习,通过“深度卷积神经网络”,以世界上古今中外的海量棋谱作为训练样本,进行训练,训练出的神经网络可以达到业余高手的水平。这个神经网络实现“走子网络”的功能。所以,走子网络实际上通过大量的训练,让Alphago具备了所谓的“棋感”。外界往往认为机器大局观不行,局部战斗厉害,其实是个误解。

“分身神器”其实就是蒙特卡罗搜索,在对局的时候,Alphago会让走子网络快速模拟战斗(下完整个棋局),并根据最终结果对每个位置的获胜概率进行评估。每步棋都会进行数万次的模拟,从而得到一个最终的准确的获胜概率估值,即“价值网络”。Alphago根据估值结果选择下法。到了这个阶段,机器就有了职业选手的水平了。

这里有个细节,由于走子网络需要的计算量很大,Alphago通过牺牲一些性能(精确度),将计算量缩小了1000倍,就构成了“快速走子”。这样,在特定计算资源限制下,机器可以灵活的选择是“每次模拟更准确但更少的模拟次数,还是更多的模拟次数但每次模拟结果差一些。最终的选择,是二者的混合使用(据说是前十几步让计算更准确,后面的步数让计算更快)。

左右互搏,是机器要得到更好的结果,需要更多更高质量的样本去训练“走子网络”。走子网络水平越高,机器棋感越强,价值网络的估值就更准确。Alphago通过跟自身下棋,得到了更多更高水平的训练样本(三千万次),并将这个样本回送到神经网络中进行不断学习。所以,本质上,机器就可以通过“自学习”的手段来自我提高。这个非常可怕。

最后,总结一下,最终的对局相当于一万个职业高手(王元水平的)在和李世石下棋,结果可想而知。

作者:杨明川博士

注:本文的描述受知乎作者袁行远的启发

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2016-03-12,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 灯塔大数据 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档