AI要完爆人类?一文读懂AlphaGo Zero的伟大与局限

AI科技评论按:每次AI领域有重大突破时,甚嚣尘上的“AI威胁论”必然会卷土重来。

2017年10月19日,DeepMind团队重磅发布AlphaGo Zero,再次震惊世人。相比上一代AlphaGo,该版本的AlphaGo实现了在AI发展中非常有意义的一步——”无师自通“,这也让去年败在未升级版本AlphaGo Master下的中国棋手柯洁惊呼”人类太多余了“。

相信看过之前的报道都知道,AlphaGo Zero的先进之处是可以完全从零开始,不需要任何历史棋谱的指引,更不需要参考人类任何的先验知识,完全靠自己通过强化学习(Reinforcement Learning ),左右互搏来增长棋艺,最终达到百战百胜。

那是不是就代表AI从此将进入到无需人类知识,不受人类控制的时代 ?显然还达不到。

要想理解为什么,首先从围棋这个游戏说起。围棋是一种对弈游戏,具体来说就是信息透明,规则透明,结构明确,并且可用规则是可以穷举的。而如果到了一些数据无法穷举的领域,如语音识别,图像识别,自动驾驶等,AlphaGo Zero中的算法理念很难迁移过来,也很难“无师自通”。

那AlphaGo Zero中的算法可以借鉴到哪些领域?他的核心技术是什么?他的伟大之处又是在哪里?这还得请AI科学家来谈一谈。AI科技评论得知,此版本的AlphaGo所采用的核心技术就是出自华人团队的深度残差网络(ResNet)。 就此背景,我们联系到了深度残差网络ResNet作者之一孙剑博士来对这次的技术升级做阐述。ResNet技术正是他在微软亚洲研究院时期的发明。

旷视科技(Face++)首席科学家、旷视研究院院长

在他看来,本次技术提升足够伟大,但同样在真实技术落地过程中有着众多局限,并指出未来的主流深度学习技术还将会围绕大数据训练模式的方式。换句话说,AI想脱离人类控制还为时尚早。

孙剑博士在接受AI科技评论的采访过程中说道:“AlphaGo Zero的伟大之处是第一次让机器可以不通过任何棋谱,不通过任何人类的经验,在只告诉规则的前提下就实现了成为一个围棋高手,这种无师自通的学习模式在AI整个发展上是非常有里程碑意义的。”孙剑博士讲到AlphaGo Zero的技术意义时讲到,“但是同时这种无师自通在很多AI落地上也存在一些局限,因为严格的讲,围棋规则和判定棋局输赢也是一种监督信号,所以严格意义上来讲,说人类无用,或者说机器可以自己产生认知都是对AlphaGo Zero理解的不精确。”

在很多AI行业落地中,实际上弱监督学习或无监督或者所谓的无师自通还是无法在短期成为主流。比如,就人脸识别来讲,这个能力是人类后天学习的能力,是通过时间不断演化出来的一种生存能力,人只有具备了人脸识别能力,人类社会才能正常运转,把这种后天能力输出给机器,其实就需要人的监督信号。除了人脸识别,还有很多人工智能研究的方向,比如自然语言处理,都是在模拟人类的一种技能。让机器实现这种任务就需要海量的数据与更多的信号输入。再比如医学领域的图像识别—AI医学影像读图主要依赖于高水平医生对影像的数据精标,从而机器学习对疾病的识别,这关乎于人的生命问题,自然马虎不得。所以今天,甚至今后很长一段时间内,监督学习依然是AI研究与AI商业化的主流方向。

关于AlphaGo Zero中的算法可以借鉴到哪些领域?孙剑博士没有直接给出答案,而是总结了从此算法为什么能在围棋领域表现如此出色的几点原因,首先,围棋它没有噪声,能够完美重现算法;其次围棋中的黑白子双方的信息时完全可观测的。最后,也是他认为最重要的一点,围棋对局可以用计算机迅速模拟,很快输出输赢信号。看一个领域是否能借鉴此算法,基本就要看是否满足以上三点。

AlphaGo的秘密武器:两大核心要素实现极简算法

其实AlphaGo Zero里面并没有新的巨大的理论突破,它使用的白板学习,早在之前的围棋系统Creazy Stone中就有用过。最主要还是用到了孙剑博士发明的ResNet技术, 谈到该技术时,他讲到: ”AlphaGo Zero的搜索过程简化了很多,例如把以前系统中的两个网络合并成一个网络、将深度残差网络的输入做最简化。谈到本次AlphaGo Zero在技术特点,他认为是“把19x19棋局图像直接送给神经网络,让神经网络看着棋盘做决策,这个非常简洁。”

AI科技评论认为DeepMind的这一成果的启发意义大于借鉴意义。与其想着把算法照搬过来,不如朝AlphaGo Zero启发的方向探索。在与孙剑博士在采访交流中,他表示本次AlphaGo Zero的提升主要有两个核心要素,一个是启发式搜索,一个是深度残差神经网络,而这两个又非常完美的实现了结合。其中启发式搜索的思想非常朴素,是个针对问题设计的一个高级定制版蒙特卡洛数搜索算法。另外一个核心要素是深度残差神经网络,让简单的搜索算法极大的提升了效率。

深度残差神经网络在2015年由孙剑在微软领导的视觉团队老师率先提出,并在当年在ImageNet以及COCO两大学术竞赛中包揽五项冠军,其中最重要的部分就是实现了突破性的152层的网络深度,从而让一些非常复杂的函数做映射时效率与有效性得到极大的提升。强大的网络使的AlphaGo Zero已经可以有能力学习把每一子下在那里的概率和对整个棋局的判断算的非常准确。

开放与互通是AI通往未来之路的不二法则

中国在今年发布了人工智能战略规划,起码从国家层面上是认可AI能给社会带来巨大进步。在讲到AI的未来的发展中,孙剑博士强调了开放与互通。他讲到他现在在旷视研究院每天第一件事情就是去网上开放的论文平台ArXiv看是否有新的、有意思的论文、思想发出来。

最后AI科技评论问道,ResNet被应用到AlphaGo Zero上,您有什么感受?孙剑博士表示:“这次应用在AlphaGo Zero中的ResNet残差神经网络,曾获得了CVPR 2016的最佳论文奖,我也非常高兴这个技术可以应用在AlphaGo Zero系统中,而这个应用过程其实并不需要我们直接进行接触而是一种研究成果的交流,人工智能研究最前沿的开源与开放,才能让我们在追求更优解的过程中有很多参考与理论支撑,可以极大的提升新技术产生的周期。”

孙剑博士还介绍到,旷视研究院今后还会不断分享、开放研究成果。今年7月份,旷视研究院在ArXiv公开了一篇ShuffleNet的论文,是一种可以运行在很多移动端上非常低能耗的神经网络算法,可以说是专为移动端而生的算法。发布至今不光的硬件产品、手机解锁产品使用,同时也有很多同行在使用。

AI科技评论小结:AlphaGo Zero虽没有新的突破性的技术,但这丝毫不影响它的伟大,它能够完美集成已有的技术,给研究者带来新的启发,本身已具有里程碑式的意义。他的局限在于目前只能运用到特定领域,不过,换个角度来看,这对于人类来说未必不是好事儿。总之,AI 还有很长的路要走,还需要更多像孙剑博士这样的科学家们,不断借助创新而实现更多的创新,不断借助伟大的思想创造伟大的场景。只有不断的开放最好的认知,才能让这个AI不断成长,让更多更强的AlphaGo Zero产生。

原文发布于微信公众号 - AI科技评论(aitechtalk)

原文发表时间:2017-10-21

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI科技评论

学界丨CMU风头被抢,新型DeepStack算法抢先攻克德州扑克图灵测试

在国外的学术圈里,有一份论文火了。论文里进行的研究表明,人类历史上第一次,AI在德州扑克游戏上赢得了人类职业玩家。而这份论文的突破性意义在于:AI在非完整信息的...

3659
来自专栏AI科技大本营的专栏

AlphaGo Zero,一次成功的炒作而已?

编译 | 阿司匹林 【AI 科技大本营按】2016 年 3 月,AlphaGo 击败世界顶尖职业围棋手李世石,在媒体上掀起巨大的波澜。一年多以后,AlphaG...

33910
来自专栏CDA数据分析师

人类,不要气馁 | 从李世石连败谷歌人工智能看中国制造2025

编者按:今天李世石同学又输了,感觉这个曾经的“不败少年”即将成为让广大网友集体心疼的第二个小李子。那个小李子已经拿着奥斯卡逆袭成功了,这个小李子前方的道路依然曲...

2078
来自专栏AI科技大本营的专栏

【重磅】AI击败顶级德扑玩家的秘密!德扑AI创造者现身reddit,全面解答34个提问,详解Libratus的现状和未来

翻译:刘畅、reason_W 编校:reason_W 编辑:鸽子 今年上半年,继AlphaGo多次升级连克人类高手之后,德州扑克终于也迎来了它的“破壁人”——...

2864
来自专栏镁客网

分数出炉!吊炸天的人工智能竟被高考秒成渣

1134
来自专栏机器人网

会诈唬、会算计、会打扑克的AI会搞什么事情?

经过五天的鏖战,德州扑克人工智能系统Libratus毫无悬念获得最终胜利。在这场德州扑克人机大战中,中国龙之队的六位牌手共与冷扑大师打了36000手牌,共输79...

30710
来自专栏AI科技评论

滴滴章文嵩将派单问题与AlphaGo相比较,被怼「不懂围棋」

滴滴副总裁章文嵩表示,滴滴所面临的问题复杂度比 AlphaGo 要复杂得多。棋圣聂卫平反问,围棋有 361个格子,你知道这其中的变化量是多少吗? AI 科技评论...

2666
来自专栏新智元

【王小川】谷歌 AI 将完胜围棋世界冠军李世石

新浪科技讯 2月3日下午消息,谷歌发布旗下深度学习研究成果——围棋程序AlphaGo后,引起热议。关于3月份与韩国围棋国手李世石的较量也让业界纷纷展开预测。同样...

2715
来自专栏灯塔大数据

洞察|AlphaGo之父揭开打败柯洁的秘密:强AI是人类的终极工具

5月24日,在新版本AlphaGo首战以1/4子微弱优势战胜中国围棋职业九段棋手柯洁之后,“AlphaGo之父”DeepMind创始人兼CEO Demis H...

3218
来自专栏镁客网

人工智能里程碑,谷歌AlphaGo击败围棋冠军!

1863

扫码关注云+社区