他实现了AlphaGo Zero的算法,发现可能还得训练1700年 | 代码

夏乙 发自 凹非寺 量子位 出品 | 公众号 QbitAI

AlphaGo退隐,留下身后一众你追我赶的围棋AI。

比如说前些天在野狐上连斩多名职业选手的新版绝艺“符合预期”,又比如说多年研究国际象棋和围棋AI的gcp,最近又把AlphaGo Zero的算法实现出来放到了GitHub上,起名叫Leela Zero

地址:https://github.com/gcp/leela-zero

gcp是谁?

Gian-Carlo Pascutto,这是他的全名。

这位比利时程序员小哥,研究用计算机下棋已经不是一年两年了。早在上个世纪,他就开始在Adrien Regimbald的开源象棋引擎Faile基础上开发自己的国际象棋软件了。

他所开发的国际象棋软件名叫Sjeng,苹果Mac电脑自带的国际象棋软件,所用的计算引擎就是开源版Sjeng。2003年,这位小哥还开发了一个商业版的Deep Sjeng。

Sjeng赢得过2008年世界快速计算机国际象棋锦标赛冠军、2009年世界计算机国际象棋锦标赛冠军,以及2010和2011年的网络计算机国际象棋锦标赛。

后来,gcp的兴趣转向了围棋。

他所开发的围棋软件Leela也可以说是很厉害了,2008年,Leela获得了Computer Olympiad(计算机奥林匹克)19×19围棋比赛的第三名和9×9围棋的第二名。

2017年2月,他与时俱进地发布了新版Leela,在其中用上了深度学习技术。今年8月,这个围棋软件在首届世界智能围棋公开赛中排名第8,排在它前边的,有中国大陆的绝艺、天壤,台北的CGI,日本的DeepZenGo、Rayn、AQ和韩国的石子旋风。

对了,你用过强大的音频播放器foobar2000吗?这位小哥也是作者之一。

自学版AlphaGo Zero发布之后,gcp显然要再与时俱进一次。

Leela Zero

这一次与时俱进的成果,就是Leela Zero。

Leela Zero是AlphaGo Zero论文Mastering the Game of Go without Human Knowledge的实现,据gcp在GitHub上介绍,这个实现非常忠于原文,目标就是搞一个开源的AlphaGo Zero。

作为AlphaGo Zero的忠实实现,Leela Zero使用了蒙特卡洛树搜索(MCTS)和深度残差卷积神经网络堆栈,不需要输入人类棋谱,可以在自我对弈中提升。

但是,Leela Zero和真正的AlphaGo Zero还差一个很重要的东西:网络权重。

gcp在Leela Zero的GitHub说明中称,这份实现中不包含网络权重,如果能搞到AlphaGo Zero的权重,这个程序能和真的狗一样强。

但问题在于,他算了一下,如果要在普通消费级硬件上重新计算一遍AlphaGo Zero的权重,也就是让Leela Zero进化到AlphaGo Zero退隐时候的水平,需要1700年。

这个普通消费级硬件,指的是一块英伟达GTX 1080 Ti。

所以,Leela Zero现在应该算是个没有灵魂的躯壳,等着来自大规模GPU的计算力赋予它真正的生命。gcp把这个算法实现出来之后,就开始到处发帖征集志愿者来一起贡献GPU算力训练它。

如果你不想贡献GPU,只想试试这个围棋软件的话,gcp也提供了一版用人类棋谱训练的小型网络供下载:https://sjeng.org/zero/best_v1.txt.zip。

当然,还是一起训练完整版Leela Zero更exciting。

原文发布于微信公众号 - 量子位(QbitAI)

原文发表时间:2017-11-27

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏量子位

2:0!柯洁次战中盘告负AlphaGo,表现一度完美

唐旭 若朴 发自 东瑶村 量子位 报道 | 公众号 QbitAI 鏖战155手,柯洁二战AlphaGo再次落败。中盘告负。 这场比赛的激烈和复杂程度,超越双方的...

33511
来自专栏新智元

【AlphaGo2.0乌镇首局击败柯洁】人机最伟大对弈剖解,超级AI阿老师将围棋3维化

【新智元发自中国乌镇】在围棋峰会开幕式致辞中,DeepMind CEO Demis 表示,樊麾已经成为 AlphaGo 开发团队中的一位重要成员。樊麾表示,自己...

2815
来自专栏镁客网

现在的谷歌AlphaGo想挑战顶级选手会成功吗?

2115
来自专栏企鹅号快讯

解密!德扑界的AlphaGo:击败顶级德扑玩家的AI赌神Libratus

“AlphaGo退休了,我们还有赌神Libratus。” 今年上半年,AlphaGo多次升级连克人类高手,甚至以3:0一举击败如今世界排名第一的柯洁。而在德州扑...

24310
来自专栏量子位

AlphaGo教学工具上线!人人可用,柯洁称要重新学围棋

安妮 发自 凹非寺 量子位 出品 | 公众号 QbitAI ? 昨晚,一条来自“AlphaGo人肉臂”黄士杰博士的消息又引爆了整个朋友圈和Facebook: 大...

3809
来自专栏量子位

德扑人机大战落幕:AI赢了200万美元,这里是一份超详细的解读

作者 | 量子位 舒石 ? △ 今日凌晨产生的人机大战最终结果 176万,美元。 经过20天的鏖战之后,四位顶级人类扑克高手,在这场德州扑克人机大战中,总共输给...

3265
来自专栏企鹅号快讯

AlphaGo打败人类后,又打败了“自家兄弟”?

话说2017年人工智能发展的重大事件,那就是AlphaGo战胜棋手柯洁,并横扫了整个围棋界选手。在战胜柯洁后短短的五个月,谷歌deepmind团队在10月份公布...

2180
来自专栏量子位

柯洁食言:明年四月,再战AI

李根 发自 凹非寺 量子位 报道 | 公众号 QbitAI “我说不再跟AI下棋,现在食言了。” 刚刚,人类围棋第一人柯洁九段宣布:明年4月,将再次与围棋AI...

2863
来自专栏企鹅号快讯

不再和人工智能对弈?柯洁:我要食言了

中青在线讯(中国青年报·中青在线记者 梁璇)刚拿下个人第五个世界冠军的柯洁九段,12月27日上午在首届“吴清源杯”世界女子围棋赛暨2018世界人工智能围棋公开赛...

2165
来自专栏镁客网

世界围棋第一人柯洁约战AlphaGo?官方回应:尚无下一步比赛计划

1747

扫码关注云+社区

领取腾讯云代金券