专栏首页量子位AlphaZero完胜三大世界冠军棋类程序:5000个TPU、自学一天

AlphaZero完胜三大世界冠军棋类程序:5000个TPU、自学一天

Root 编译整理 量子位 出品 | 公众号 QbitAI

昨天,DeepMind团队又在arXiv上扔了个重磅炸弹,新一代AlphaZero在用了强劲的计算资源(5000个一代TPU和64个二代TPU)之后,用不到24小时的时间自我对弈(tabula rasa,也叫白板)强化学习,接连击败了三个世界冠军级的程序 (国际象棋、将棋、围棋)。

AlphaZero和国际象棋冠军程序对弈

其中包括上一代冠军围棋程序AlphaGo Zero,这个程序发布还不到两个月,DeepMind就又把自己颠覆了(所以谷歌团队自我进化速度的时间单位都是按天计,可怕)。

AlphaZero的百局战绩

  • 对弈国际象棋程序Stockfish:28胜,72平;
  • 对弈将棋程序 Elmo:90胜,2平,8负;
  • 对弈围棋程序AlphaGo Zero:60胜,40负。

AlphaZero自我对弈的训练时间

  • 训练次数 | 训练时间 | 对弈冠军棋类程序
  • 30万,2小时,击败将棋Elmo
  • 11万,4小时,击败国际象棋Stockfish
  • 16.5万,8小时,击败围棋AlphaGo

把Go去掉,意味着AlphaZero ,已经是比AlphaGo Zero更通用的程序。

一直以来,尽管众多顶尖的AI的程序都超过了人类世界冠军的水平,但它们都只能在单一的领域执行单一的任务,并不能把这种击败人类的超能力泛化到其他任务中。

而DeepMind的野心可不仅仅是在棋类游戏上超越人类,这次他们研究出了这个更通用的程序AlphaZero,将会马上投入到蛋白折叠的应用上

官方称,他们不久就会发表相关论文,通过检测出蛋白错误折叠来快速诊断神经退行性疾病,比如阿尔茨海默症,帕金森,囊状纤维化。

期待AlphaZero在医疗健康领域的表现。

更多棋技的讨论,可以参看知乎上的PENG Bo的评价:https://zhuanlan.zhihu.com/p/31749249

原论文链接:https://arxiv.org/pdf/1712.01815.pdf

本文分享自微信公众号 - 量子位(QbitAI),作者:专注报道AI

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2017-12-07

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • AlphaZero登上《科学》封面:一个算法“通杀”三大棋,完整论文首次发布

    不仅会下围棋,还自学成才横扫国际象棋和日本将棋的DeepMind AlphaZero,登上了最新一期《科学》杂志封面。

    量子位
  • 我,Jeff Dean弟子,拒过Bengio的offer,还需要去混个本科学历么?

    Chris Olah,谷歌大脑研究员,OpenAI团队leader,和Jeff Dean、Yoshua Bengio都有密切的学术渊源。

    量子位
  • 亚马逊发布智能时尚助手Echo Look,引发大量吐槽

    安妮 李林 编译整理 量子位 出品 | 公众号 QbitAI 昨天,亚马逊推出了一款名叫Echo Look的新设备。它在Alexa、Echo基础之上添加了拍照与...

    量子位
  • 数据结构与算法—栈详解(看完面试考试再也不怕了)

    和数组形成的栈有个区别。就是理论上栈没有大小限制(不突破内存系统限制)。不需要考虑是否越界。

    bigsai
  • 10分钟详解Spring全家桶7大知识点

    Spring框架自诞生以来一直备受开发者青睐,有人亲切的称之为:Spring 全家桶。它包括SpringMVC、SpringBoot、Spring Cloud、...

    苏先生
  • qt学习第2天:QRadioButtonTest+ButtonGroup单选后提示消息,QComBox

    项目名称:QRadioButtonTest 运行结果:选中按钮后其他则无法继续选择,点击save后提示选择了那个按钮 在QRadioButtonTest.h...

    cuptobjut
  • Python之 ansible 动态In

    Ansible Inventory 是包含静态 Inventory 和动态 Inventory 两部分的,静态 Inventory 指的是在文件中指定的主机和组...

    py3study
  • ni**的网站的登录需要的sensor_data怎么来

    sensor_data 这个东西,相信都有很多人知道这个东西,我之前也搞过这个网站的登录,但是不成功,只能得到某些网页的数据,对于登录,当时是一直被拒绝的,就像...

    sergiojune
  • 什么是 JSON Web Token(JWT)

    JSON Web Token (JWT) 作为一个开放的标准 (RFC 7519) 定义了一种简洁自包含的方法用于通信双方之间以 JSON 对象的形式安全的传递...

    HoneyMoose
  • 001仓储物流自动化这行是干嘛的?

    物资各式各样,仓库可大可小,存储的方法当然也是多种多样。仓储其实就每天发生在我们生活中的每一天,比如小到我们的衣物存储到衣柜里,书籍存放到书架里,文件存放到档案...

    老King

扫码关注云+社区

领取腾讯云代金券