专栏首页量子位他实现了AlphaGo Zero的算法,发现可能还得训练1700年 | 代码

他实现了AlphaGo Zero的算法,发现可能还得训练1700年 | 代码

夏乙 发自 凹非寺 量子位 出品 | 公众号 QbitAI

AlphaGo退隐,留下身后一众你追我赶的围棋AI。

比如说前些天在野狐上连斩多名职业选手的新版绝艺“符合预期”,又比如说多年研究国际象棋和围棋AI的gcp,最近又把AlphaGo Zero的算法实现出来放到了GitHub上,起名叫Leela Zero

地址:https://github.com/gcp/leela-zero

gcp是谁?

Gian-Carlo Pascutto,这是他的全名。

这位比利时程序员小哥,研究用计算机下棋已经不是一年两年了。早在上个世纪,他就开始在Adrien Regimbald的开源象棋引擎Faile基础上开发自己的国际象棋软件了。

他所开发的国际象棋软件名叫Sjeng,苹果Mac电脑自带的国际象棋软件,所用的计算引擎就是开源版Sjeng。2003年,这位小哥还开发了一个商业版的Deep Sjeng。

Sjeng赢得过2008年世界快速计算机国际象棋锦标赛冠军、2009年世界计算机国际象棋锦标赛冠军,以及2010和2011年的网络计算机国际象棋锦标赛。

后来,gcp的兴趣转向了围棋。

他所开发的围棋软件Leela也可以说是很厉害了,2008年,Leela获得了Computer Olympiad(计算机奥林匹克)19×19围棋比赛的第三名和9×9围棋的第二名。

2017年2月,他与时俱进地发布了新版Leela,在其中用上了深度学习技术。今年8月,这个围棋软件在首届世界智能围棋公开赛中排名第8,排在它前边的,有中国大陆的绝艺、天壤,台北的CGI,日本的DeepZenGo、Rayn、AQ和韩国的石子旋风。

对了,你用过强大的音频播放器foobar2000吗?这位小哥也是作者之一。

自学版AlphaGo Zero发布之后,gcp显然要再与时俱进一次。

Leela Zero

这一次与时俱进的成果,就是Leela Zero。

Leela Zero是AlphaGo Zero论文Mastering the Game of Go without Human Knowledge的实现,据gcp在GitHub上介绍,这个实现非常忠于原文,目标就是搞一个开源的AlphaGo Zero。

作为AlphaGo Zero的忠实实现,Leela Zero使用了蒙特卡洛树搜索(MCTS)和深度残差卷积神经网络堆栈,不需要输入人类棋谱,可以在自我对弈中提升。

但是,Leela Zero和真正的AlphaGo Zero还差一个很重要的东西:网络权重。

gcp在Leela Zero的GitHub说明中称,这份实现中不包含网络权重,如果能搞到AlphaGo Zero的权重,这个程序能和真的狗一样强。

但问题在于,他算了一下,如果要在普通消费级硬件上重新计算一遍AlphaGo Zero的权重,也就是让Leela Zero进化到AlphaGo Zero退隐时候的水平,需要1700年。

这个普通消费级硬件,指的是一块英伟达GTX 1080 Ti。

所以,Leela Zero现在应该算是个没有灵魂的躯壳,等着来自大规模GPU的计算力赋予它真正的生命。gcp把这个算法实现出来之后,就开始到处发帖征集志愿者来一起贡献GPU算力训练它。

如果你不想贡献GPU,只想试试这个围棋软件的话,gcp也提供了一版用人类棋谱训练的小型网络供下载:https://sjeng.org/zero/best_v1.txt.zip。

当然,还是一起训练完整版Leela Zero更exciting。

本文分享自微信公众号 - 量子位(QbitAI),作者:专注报道AI

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2017-11-27

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 酷哇机器人获1.35亿元B轮融资,软银和CCV领投,已落地长沙无人扫地车

    今天(5月18日),其运营主体酷哇机器人(COWAROBOT)宣布获1.35亿元B轮融资。由软银中国领投,创世伙伴资本联合领投,盈峰投资、睿鲸资本、中民金服、芜...

    量子位
  • 复制即可翻译,PDF文本翻译神器!这个“宝藏”翻译软件火了

    最近,一个名为CopyTranslator的外语辅助阅读和翻译软件引发了不小的关注。

    量子位
  • 毕啸南专栏 | 对话驭势CEO吴甘沙:无人车结盟竞争是大势所趋

    作者简介:毕啸南,知名青年学者,量子位专栏作家,《中国AI领袖人物访谈》系列制片人、主持人。点击文末阅读原文,关注量子学园的毕啸南专栏,跟随他一起持续深度对话李...

    量子位
  • 解决WebService中System.InvalidOperationException:缺少参数的问题

    此问题在.Net 4.0 IIS7 Windows Server 2008下可能会出现。 现象是第一次正常调用,第二次接口报错。 删除CacheDurati...

    从今若
  • 分布式NewSQL数据库实践——民生银行经典案例

    此前,金融信息化建设主要依托原有集中型 IT 架构进行维护扩展,系统规模及复杂程度呈指数级增长,各类瓶颈逐渐暴露,日益增长的数字金融需求同旧式的系统架构缺陷之间...

    CSDN技术头条
  • 对话李飞飞:云数据库战争已经进入下半场

    李飞飞,现任阿里巴巴集团副总裁、高级研究员,阿里云智能数据库事业部总负责人。加入阿里巴巴之前为美国犹他大学计算机系终身教授。研究成果多次获得了IEEE ICDE...

    数据和云
  • 磊哥测评之数据库saas篇:腾讯云控制台、DMC和小程序

    随着云计算和数据库技术的发展,数据库正在变得越来越强大。数据库的性能如处理速度、对高并发的支持在节节攀升,同时分布式、实时的数据分析、兼容主流数据库等强大的性能...

    磊哥测评
  • Entity Framework DBFirst尝试

    “Database First”模式我们称之为“数据库优先”,前提是你的应用已经有相应的数据库,你可以使用EF设计工具根据数据库生成数据数据类,你可以使用Vis...

    aehyok
  • 2020职场技术技能排行榜

    近日,在线教育网站 Udemy 根据其学员的课程数据,制作了一份《2020 年职场学习趋势报告》。

    加米谷大数据
  • 第99天:CSS3中透视perspective

    与之前的过程相同,视点与移动后的元素的连线与屏幕的焦点就是在屏幕上的呈现的元素的大小,与元素相比较变大了。

    半指温柔乐

扫码关注云+社区

领取腾讯云代金券