前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >ALPHA ZERO对象棋的启示

ALPHA ZERO对象棋的启示

作者头像
企鹅号小编
发布2018-01-11 14:52:08
1.6K0
发布2018-01-11 14:52:08
举报
文章被收录于专栏:企鹅号快讯企鹅号快讯

2016年1月27日,《自然》刊文报道,谷歌公司开发人工智能程序alpha go(阿尔法围棋)以5:0的战绩完胜欧洲冠军,围棋职业二段樊麾。这是围棋人工智能首次战胜人类职业棋手。这在围棋界掀起了一个不大不小的波澜。之所以不大,是因为樊麾并不能代表人类最高水平。另外当时人们对ALPHA GO知之甚少,仅从棋谱上看,仍有不小的瑕疵。

2016年3月9日至3月15日,ALPHA GO在韩国首尔以4:1的战绩战胜人类顶尖棋手,韩国围棋职业棋手李世石九段。如果说战胜樊麾只是ALPHA GO的小试牛刀,人们对ALPHA GO的实力还有些许怀疑,那么这一战就是真正征服了围棋,人类智力游戏的最后堡垒被攻克。

谈及围棋的人工智能程序,自然会联想到象棋的人工智能程序(象棋和国际象棋的复杂度基本在一个量级,两者人工智能程序的原理也是相同的。为了论述方便,以下统简称为象棋)。在普通的民众看来,二者似乎没有太大的区别,都是人类发明的下棋机器。其实二者还是有一定的不同的。简单地说,象棋的人工智能采用的是近似一种穷举法,就是穷尽棋局的所有可能,然后从中选出最优的棋路。然而国际象棋和象棋的总状态数分别为10的120次方和10的150次方,是极其复杂的。比方说计算机一微秒行棋一步,大概需要10的140方年的时间才可以生成象棋的全部状态,也就是穷尽象棋的所有变化。10的140次方年的时间是个什么样的概念?据估计,宇宙的生命大概为10 的10次方年。可见穷尽象棋的变化是不可能的。实际应用中,象棋软件只是尽可能的搜索更多的局面,然后通过对局面的评估和打分,对已经搜索到局面进行裁剪,从而选出最优棋路。而不是搜索到底。

而围棋的人工智能则有不同。因为围棋的变化要大于象棋的变化,变化数达到了10的360方,更为关键的是无法像象棋人工程序那样对局面进行准确的分析与评估。因为这需要大量的专业知识,即人们归纳总结出来的象棋理论。而对于围棋来说,人类无法把掌握的围棋知识告诉计算机。谷歌公司另辟蹊径,采用蒙特卡洛算法来解决这个问题。蒙特卡洛算法简单的说就是随机模拟游戏的过程,并根据结果对整个过程进行评估,从而形成评估局面的能力。可是围棋的变化是个天文数字,完整棋局的模拟的状态数过大,阻碍了人工智能围棋水平的提高。谷歌公司将深度学习方法引入蒙特卡洛算法,在众多可能中选择可能性较高的选项。这就大大缩小了蒙特卡洛树的范围,提高了选择的准确性。从而突破瓶颈,达到围棋的顶级水平。

由以上简单的分析可以看出,围棋人工智能和象棋的人工智能关键不同在于如何对局面进行评估。象棋是建立在人类总结出来的象棋知识的基础上,结合计算机工作者和象棋职业棋手的专业技能。在科学主义理念下,试图以理性和逻辑为基础求出最优解。而围棋的人工智能对局面的评估没有任何仍的人类知识,只是通过在大量的随机的模拟而形成直觉来解决。人类推崇的理性逻辑没有解决的难题,反而被简单直觉,或者说以直觉为基础的人工智能解决掉了。简单的说象棋的人工智能是以逻辑为基础的机器,围棋的人工智能是以直觉为基础的机器。

如今谷歌公司最新通用算法ALPHA ZERO,不仅从零开始学会了下围棋,同时也可以从零开始学会下国际象棋。经过12个小时自我对弈的模拟训练,ALPHA ZERO战胜了世界顶级国际象棋程序Stockfish(鳕鱼)。前世界棋王卡斯帕罗夫评论道,ALPHA ZERO是用一种近似人的方式来下象棋。似乎可以这样认为,这一次直觉战胜了逻辑。理性主义和科学主义主导的现代文明导致了我们作为一个人的直觉持续退化,迫使我们沦为机器的附属。就好比现在,我们手里的这个家伙,我们花银子买了它,它却霸占了我们

我想用DeepMind创始人兼CEO哈萨比斯一句话作为结尾,来唤醒我们的直觉,并用直觉从新审视象棋,这个人类古老智慧的结晶!

本文来自企鹅号 - 吾道不孤媒体

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文来自企鹅号 - 吾道不孤媒体

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
大数据
全栈大数据产品,面向海量数据场景,帮助您 “智理无数,心中有数”!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档