【环球网智能报道 记者 张阳】今天,《自然》杂志刊登了谷歌DeepMind团队的新成果,名为AlphaZero的机器系统仅训练3天就战胜了AlphaGo Lee,比分100:0,后者就是战败李世石的那套。经过40天训练后,Alpha Zero又以89:11战胜了Alpha Master,即横扫柯洁的那套。对此柯洁评论称,对于alphago的自我进步来讲...人类太多余了。
结果表明,具体到不同技术的效果,人工智能在这一领域仍有很多学习的空间。AlphaGo Master使用了很多与AlphaGo Zero相同的开发技术,但它需要首先利用人类的数据进行训练,随后才切换成自我对弈。Alpha Zero的设计理念和系统配置完全和Lee/Master不同,它不依托于人类的先验成果,完全靠自我对弈学习下棋。
另外,AlphaGo Zero也比前几代系统更加节能,AlphaGo Lee需要使用几台机器和48个谷歌TPU机器学习加速芯片。其上一代AlphaGo Fan则要用到176个GPU芯片。AlphaGo Zero只需要使用一台配有4个TPU的机器即可。
领取专属 10元无门槛券
私享最新 技术干货