AlphaGo Zero来了!人工智能第一次摆脱人工,靠自己就智能了!

柯洁与“阿尔法狗”的人机大战,大家应该都还没忘吧!柯洁九段以难以逾越的劣势,0:3败给“阿尔法狗”,泪撒棋场。这一幕,让大家都纷纷感叹人工智能的完美!

这一切仿佛发生在昨天,很快,DeepMind团队又宣布了一个在AI历史上具有里程碑式意义的重磅消息:新版AlphaGo可以彻底摆脱人类的知识。

10月18日,谷歌人工智能团队DeepMind团队在期刊《Nature》上发表论文,宣布新版AlphaGo——AlphaGo Zero可以在没有人类指导的情况下学习。

厉害了我的谷歌!

DeepMind团队表示,AlphaGo Zero的研发与其前身有很大不同。研究团队不是根据已知的人类发展战略使AI智能化,而是经过短暂的训练使软件能够轻松击败此前的版本。 AlphaGo Zero能不断更新自己的游戏知识,越来越好。

经过三天的不间断比赛,Zero能够击败去年已经战胜人类围棋世界冠军的AlphaGo版本。事实上,AlphaGo Zero连续赢得了100场比赛,取得全胜战绩。

AlphaGo Zero的主要研发程序员Daid Siler在新闻发布会上解释说:“通过不使用人类数据 - 通过不以任何方式使用人力知识,我们实际上已经消除了人类知识的限制。因此,它能够从第一原则创造知识。”

简而言之,通过不试图模仿最好的人类围棋选手,AlphaGo Zero实际上消除了任何偏见或疏忽,从而创造出更为纯粹的策略。

要知道,去年,阿尔法狗代表人工智能在围棋领域首次战胜了人类的世界冠军,但他棋艺的精进,是建立在计算机通过海量的历史棋谱学习参悟人类棋艺的基础上,进而自我训练,实现超越的。

可是今天,我们发现,人类其实是把阿尔法狗教坏了!新一代的人工智能Zero,完全从零开始,不需要任何历史棋谱的指引,更不需要参考人类任何的先验知识,完全靠自己一个人强化学习和参悟,棋艺增长远超过阿尔法狗,百战百胜,击溃阿尔法狗100-0。

所以说,此次AlphaGo Zero的出现不仅仅意味着围棋上的成功,还意味着距离通过创建通用算法来解决科学中的难题又进了一步。

目前深度学习需要大量数据,而数据的获得成本高昂且难度十分大,有了这项技术后,人类今后将有可能解决更大的挑战,给人类生活带来根本性的变化。

DeepMind首席执行官Demis Hassabis承认,以运用这个技术解决实际生活中的许多问题。范围可以包括预测蛋白质分子的形状,这也是新药研发过重的重要一环;还可以设计新材料和进行气候建模。

相较于之前版本,AlphaGo Zero的表现和训练效率都有了很大的提升,仅通过4块TPU和72小时的训练就能够胜过之前训练用时几个月的原版AlphaGo。在放弃学习人类棋手的走法以及人工提取特征之后,算法能够取得更优秀的表现,这体现出深度神经网络强大的特征提取能力以及寻找更优解的能力。更重要的是,通过摆脱对人类经验和辅助的依赖,类似的深度强化学习算法或许能更容易地被广泛应用到其他人类缺乏了解 或是缺乏大量标注数据的领域。

另外文章还发布了AlphaGo Zero的学习过程,很有意思,训练刚开始的时候和我们小时候的下法差不多,就是直接缠成一片,之后就开始学会一些所谓的“定式”。围棋爱好者应该能看出很多有趣的东西。

小编作为一个技术盲,刚看到这个结果的时候还是很兴奋的,本来以为DeepMind已经停止开发AlphaGo了。另外之前很多人都说AlphaGo已经是所谓工程的极致,但没想到性能和效率上还能有这么大提升的空间。新的算法在结构与训练方式都比原来看上去简洁了。

真是很漂亮的工作!有生之年能见证技术爆炸,真的是死而无憾了!谷歌加油!

虽然这才刚开始,虽然可能性很小,但我也许是见证了技术爆炸的第一步。人工智能第一次摆脱人工,只靠自己就智能了!

只要3小时的自我学习就能赶超人类2000多年的围棋理论精华,要是这种自我学习算法能推广到其他任何领域,不论是啥,都可能会颠覆或者超越人类整个历史所积淀的经验,这绝对是3个月带飞3000年的节奏了!

  • 发表于:
  • 原文链接:http://kuaibao.qq.com/s/20180314A0ONAG00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。

扫码关注云+社区

领取腾讯云代金券