2017年5月,在中国乌镇围棋峰会上,AlphaGo与排名世界第一的世界围棋冠军柯洁对战,以3比0的总比分获胜。围棋界公认阿尔法围棋的棋力已经超过人类职业围棋顶尖水平。
AlphaGo,击败人类职业围棋选手、战胜围棋世界冠军的人工智能程序,究竟是何方神圣?
01
AlphaGo
AlphaGo由谷歌旗下DeepMind公司戴密斯·哈萨比斯领衔的团队开发的人工智能程序,其主要工作原理是“深度学习”。AlphaGo名字的由来:alpha,希腊字母表的第一个字母;有第一个、开端、最初的含意。go,日本对围棋的叫法,因为围棋职业化和段位制都是从日本棋院发展而来。AlphaGo也就是第一个(智能)围棋的意思。
02
旧版AlphaGo
1、 工作原理
阿尔法围棋(AlphaGo)要工作原理是“深度学习”。“深度学习”是指多层的人工神经网络和训练它的方法。
2、工作系统
(1)策略网络,给定当前局面,预测并采样下一步的走棋
(2)快速走子,目标和策略网络一样,但在适当牺牲走棋质量的条件下,速度要比策略网络快1000倍;
(3)价值网络,给定当前局面,估计是白胜概率大还是黑胜概率大;
(4)蒙特卡洛树搜索,把以上这三个部分连起来,形成一个完整的系统。
3、战绩
2016年3月,AlphaGo以4:1战胜韩国职业九段棋手李世石。随后化身Master与中日韩数十位围棋高手进行快棋对决,连续60局无一败绩。2017年5月,它与排名世界第一的世界围棋冠军柯洁对战,以3比0的总比分获胜。
03
新版AlphaGo(AlphaGo zero)
1、 工作原理
AlphaGo zero主要的工作原理是自学成才。AlphaGo zero和AlphaGo最大的区别是,它不再需要人类数据。也就是说,它一开始就没有接触过人类棋谱。研发团队只是让它自由随意地在棋盘上下棋,然后进行自我博弈。
2、 战绩
经过短短3天的自我训练,AlphaGo Zero就强势打败了此前战胜李世石的旧版AlphaGo,战绩是100:0的。经过40天的自我训练,AlphaGo Zero又打败了AlphaGo Master版本。“Master”曾击败过世界顶尖的围棋选手,甚至包括世界排名第一的柯洁。
小编的话:AlphaGo打败世界排名第一的柯洁,表明阿尔法围棋的棋力已经超过人类职业围棋顶尖水平,是否就代表人工智能战胜人类呢?其实不然,人工智能至少人类进步的辅助工具,人工智能是建立在人类智慧基础上的,AlphaGo的创世团队DeepMind表示,人工智能作为科学工具和人类智慧的加速器,将会致力于解决更多复杂的问题,AlphaGo仅仅只是个开始。
领取专属 10元无门槛券
私享最新 技术干货