AlphaZero:通用型的棋类人工智能程序

今年,Deepmind的“AlphaGo”在围棋领域的胜利让不少人了解到人工智能的强大。当时有人还认为没有人类棋手的经验,人工智能很难快速达到如今的成绩,但后来推出的AlphaGo Zero却是从0开始,自己学习围棋,又取得超越AlphaGo的成绩。如今Deepmind再次将这种强大的算法泛化,提出了AlphaZero:一种可以从零开始,在多种不同的任务中通过自我对弈,达到超越人类水平的新算法。这种算法可以通过24小时的对弈训练后,就可以在日本将棋和国际象棋领域击败目前业内顶尖的计算机程序(这些程序早就战胜了人类棋手)。以下是AlphaZero取得的成绩:

8小时自我训练战胜李世石版本AlphaGo;12小时自我训练战胜世界顶级国际象棋程序Stockfish;14小时自我训练战胜世界顶级将棋程序Elmo。

国际象棋算法的历史和计算机一样古老,虽然很多计算机大师在很久以前就开始了国际象棋算法的开发,但众所周知,国际象棋算法仍然花费了很久才战胜了人类。国际象棋算法存在一个问题,就是它只能在国际象棋领域起作用,如果不经过大幅改造,这个算法是完全不能在其他领域其作用,而大幅改造又失去了利用这一算法的意义。

创造一个规则简单但能在不同领域应用的算法一直是人工智能领域的重要课题。AlphaGo Zero就是一种使用卷积神经网的算法,它可以只通过强化学习进行自我对弈训练,也就是只通过输入围棋规则就能达到超越人类的水平。而新开发的AlphaZero则是能在其他领域获得同样的成绩,在没有输入除了规则以外的任何信息的情况下,AlphaZero仍然可以通过自我学习取得战胜人类顶尖选手的成绩。

1997年“深蓝”击败人类世界冠军卡斯帕罗夫,从那以后计算机程序的国际象棋水平一直在人类之上。这些程序必须得按照人类大师仔细调整的权重来计算落子的优劣。在日本将棋领域,计算机程序的进展就更为缓慢了,日本将棋棋盘更大,而且被吃掉的棋子可以改变阵营,重新上场,还能被放置在大部分位置上。正是因为这些原因,知道2017年计算机程序才在日本将棋领域战胜人类冠军。而围棋的规则是相对比较简单的,适合AlphaGo中的神经网络体系结构。

这三种棋有着很大的区别,从基础构架来说并不兼容,如果让AlphaGo去学习日本将棋和国际象棋是很困难的。但是AlphaZero却不但能完胜其他程序,还能用更少的计算量实现胜利。(王蔚)

本文来自企鹅号 - 中国经济网媒体

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI科技大本营的专栏

【重磅】AI击败顶级德扑玩家的秘密!德扑AI创造者现身reddit,全面解答34个提问,详解Libratus的现状和未来

翻译:刘畅、reason_W 编校:reason_W 编辑:鸽子 今年上半年,继AlphaGo多次升级连克人类高手之后,德州扑克终于也迎来了它的“破壁人”——...

33640
来自专栏AI科技大本营的专栏

最懂机器学习的围棋高手,解读柯洁首战AlphaGo时的失误

解读柯洁大战AlphaGo,当然离不开围棋界最懂机器学习的高手。 本次,我们很荣幸邀请到围棋队的电脑专家——余平大师,来为我们讲解第一盘人机大战。 首先,当然...

30290
来自专栏新智元

【王小川】谷歌 AI 将完胜围棋世界冠军李世石

新浪科技讯 2月3日下午消息,谷歌发布旗下深度学习研究成果——围棋程序AlphaGo后,引起热议。关于3月份与韩国围棋国手李世石的较量也让业界纷纷展开预测。同样...

28750
来自专栏PPV课数据科学社区

清华大学马少平:AlphaGo的成功是蒙特卡洛树搜索加深度学习的胜利

作者:马少平 清华大学计算机系教授,博士生导师,中国人工智能学会副理事长,中国中文信息学会副理事长。主要研究方向为智能信息处理,包括文本信息检索、网络用户行为分...

471130
来自专栏AI科技评论

AlphaGo 将在 2017 年重磅复出,业内人士怎么看?

今日,DeepMind CEO Demis Hassabis 在 Twitter 上发布声明:他们正在全力提高 AlphaGo 的智能程度,全新版 AlphaG...

35460
来自专栏AI科技大本营的专栏

AlphaGo Zero,一次成功的炒作而已?

编译 | 阿司匹林 【AI 科技大本营按】2016 年 3 月,AlphaGo 击败世界顶尖职业围棋手李世石,在媒体上掀起巨大的波澜。一年多以后,AlphaG...

356100
来自专栏星流全栈

图解机器学习

13640
来自专栏量子位

新AlphaGo首度揭秘:单机运行,4个TPU,算法更强(专访+演讲)

舒石 唐旭 发自 东瑶村 量子位 报道 | 公众号 QbitAI ? 到底是谁击败了柯洁? 答案似乎显而易见。但量子位之所以问这个问题,是因为如今击败柯洁的Al...

387130
来自专栏AI科技评论

学界丨CMU风头被抢,新型DeepStack算法抢先攻克德州扑克图灵测试

在国外的学术圈里,有一份论文火了。论文里进行的研究表明,人类历史上第一次,AI在德州扑克游戏上赢得了人类职业玩家。而这份论文的突破性意义在于:AI在非完整信息的...

46590
来自专栏企鹅号快讯

2017年AI技术盘点:关键进展与趋势

人工智能最近三年发展如火如荼,学术界、工业界、投资界各方一起发力,硬件、算法与数据共同发展,不仅仅是大型互联网公司,包括大量创业公司以及传统行业的公司都开始涉足...

20350

扫码关注云+社区

领取腾讯云代金券