战胜柯洁的AlphaGo到底是何方神圣？

文章来源：企鹅号 - 华中大研科协GAST

2017年5月，在中国乌镇围棋峰会上，AlphaGo与排名世界第一的世界围棋冠军柯洁对战，以3比0的总比分获胜。围棋界公认阿尔法围棋的棋力已经超过人类职业围棋顶尖水平。

AlphaGo，击败人类职业围棋选手、战胜围棋世界冠军的人工智能程序，究竟是何方神圣？

AlphaGo

AlphaGo由谷歌旗下DeepMind公司戴密斯·哈萨比斯领衔的团队开发的人工智能程序，其主要工作原理是“深度学习”。AlphaGo名字的由来：alpha，希腊字母表的第一个字母；有第一个、开端、最初的含意。go，日本对围棋的叫法，因为围棋职业化和段位制都是从日本棋院发展而来。AlphaGo也就是第一个（智能）围棋的意思。

旧版AlphaGo

1、工作原理

阿尔法围棋（AlphaGo）要工作原理是“深度学习”。“深度学习”是指多层的人工神经网络和训练它的方法。

2、工作系统

（1）策略网络，给定当前局面，预测并采样下一步的走棋

（2）快速走子，目标和策略网络一样，但在适当牺牲走棋质量的条件下，速度要比策略网络快1000倍；

（3）价值网络，给定当前局面，估计是白胜概率大还是黑胜概率大；

（4）蒙特卡洛树搜索，把以上这三个部分连起来，形成一个完整的系统。

3、战绩

2016年3月，AlphaGo以4:1战胜韩国职业九段棋手李世石。随后化身Master与中日韩数十位围棋高手进行快棋对决，连续60局无一败绩。2017年5月，它与排名世界第一的世界围棋冠军柯洁对战，以3比0的总比分获胜。

新版AlphaGo（AlphaGo zero）

1、工作原理

AlphaGo zero主要的工作原理是自学成才。AlphaGo zero和AlphaGo最大的区别是，它不再需要人类数据。也就是说，它一开始就没有接触过人类棋谱。研发团队只是让它自由随意地在棋盘上下棋，然后进行自我博弈。

2、战绩

经过短短3天的自我训练，AlphaGo Zero就强势打败了此前战胜李世石的旧版AlphaGo，战绩是100:0的。经过40天的自我训练，AlphaGo Zero又打败了AlphaGo Master版本。“Master”曾击败过世界顶尖的围棋选手，甚至包括世界排名第一的柯洁。

小编的话：AlphaGo打败世界排名第一的柯洁，表明阿尔法围棋的棋力已经超过人类职业围棋顶尖水平，是否就代表人工智能战胜人类呢？其实不然，人工智能至少人类进步的辅助工具，人工智能是建立在人类智慧基础上的，AlphaGo的创世团队DeepMind表示，人工智能作为科学工具和人类智慧的加速器，将会致力于解决更多复杂的问题，AlphaGo仅仅只是个开始。

发表于: 2018-01-032018-01-03 10:31:21
原文链接：http://kuaibao.qq.com/s/20180103G07QCA00?refer=cp_1026
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货

战胜柯洁的AlphaGo到底是何方神圣？

相关快讯

扫码

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐