【干货】搜狗公司CEO王小川:AlphaGo的幕后与思考

导读:人工智能一直为人们所关注,Alpha Go战胜李世石等事件,将人们对人工智能的认识和讨论推入了新的阶段。

6月6日,清华大学计算机系校友、搜狗公司CEO王小川于清华人工智能论坛上做了题为《AlphaGo的幕后与思考》的演讲,论述了在Alphago人机大战背后的故事,这场大战有着怎样的意义,以及人工智能研究和产业的碰撞。

演讲全文如下:

今天我更多想给大家分享我背后看到的关于有趣人性的东西。之前的嘉宾们讲了很多学术,学术跟企业的碰撞,最后讲一个交接点,一个大的趋势以外,还有一个人在里面扮演什么样的角色,找到自己的定位。所以我今天选了这么一个题目。这个题目中间第一件事情就是4:1的比分,每个人都已经看到了,而我对它的理解,先用一个词,它是一个学术与市场营销的完美的结合,特别是在东方,全中国人我估计95%都知道这样一场比赛,而且彻底颠覆了我们对技术、对人工智能的理解。

但是为什么这么说呢?我先用一个词,Google背后的心机。Google在今年1月份在《自然》杂志上发表了这个事,是跟樊麾打一场比赛,比赛前跟樊麾签了一个协议,我跟你比赛结果不管是输是赢,你不能对外透露任何细节,就是不能跟外面讲,是保密的,这是他干的一件事情,为什么他这么干呢?很有意思,论文发出来的时候,如果假设提前告诉了公众说先不发论文,我先跟樊麾比了一场,真正有多大学术的高度?可能没感觉,看到樊麾比赛的人会知道有学术意义,如果光看论文,大多数是没有感觉的,但是跟大众讲说我们智能赢了这个人,所以Google这个团队心思之缜密,不仅是在做研究的这群人,一下子把这个事情推到特别大的高度。

另外他们为什么选樊麾?事后诸葛再看这个事情,如果他选一个职业选手,但是是一个没有世界冠军的头衔的,我们觉得挺LOW,跟以前一样,以前好多程序都是偏业余的,感觉不好。一来给大众一个感觉,找了一个世界冠军,一个欧洲冠军,挺高的头衔,但是对专业选手而言,仅有二段,不算高手。我觉得既把眼球吸引到了,但是反过来又留下了给大家的想象和争论的空间。所以之前在1月份看到很多很多的文章在讲这个程序,其实离围棋还是很远的,这是之前的理解。

比赛之前大家是什么心态呢?比如聂卫平讲,说是觉得计算机一点机会都没有,不可克服的问题,认为机器能够下棋是没有判断力的表现,讲得很愤怒,甚至还有中国队的围棋总教练俞斌,他是在围棋界里面计算机学得最好的,在80年代就自己写下围棋的计算机程序,得到很多认可。

我认为机器是一点机会没有的,因为我认为计算机有它不可克服的问题,人和电脑相比,100%是人赢。我想在这里面能够看到人性当中脆弱的一面,每个人都有,每个人生病的时候都有自己的压迫,别人说你特蠢,微软这个东西做得特烂,大家都不开心,每个人都有自己的自尊心在里面,这件事一定会把一部分人放在我们自己的历史舞台的对立面里面去,围棋选手今天很不幸,在下棋上有这样的问题。

计算机的问题怎么讲?比如李开复讲认为AlphaGo比较悬,但是未来能赢,IT界的人不会说机器干不过人,他自己的存在感就没有了。但是通常都认为机器没有这么快,以后会赢得。这次这样一个比赛,大多数搞技术的人都没有感觉到这个事情发生有这样的速度。我很有幸,在2月份的样子,我在知乎上发帖子,说这次AlphaGo会完胜,满足了张钹院士讲的三个条件,第一,我提出了问题,我看到了下棋,人工智能在下棋上是一个重大的事,好多人觉得没有这个问题存在,没有想这个方向。第二个我看到它会赢,第三个,我知根知底知道为什么会赢,我认真地读了论文,找了下围棋的人请教,我斗胆发了这样一篇文章,是有勇气的,最后也被验证成功了,理想跟现实之间差别是很大的,对于这样一个技术趋势里面,我觉得我是有判断,但是市场股价没办法思考。

比赛前到比赛后就是七八天时间,给AlphaGo取了一个新的名字,叫“阿老师”,我们特别希望中国有人做出这样的阿老师来,把它当老师看。之前不是,之前觉得一无是处。我还很尊重他,他愿意脱帽子给机器致敬。网友叫它“狗狗”,给了很好听的名字。这里面反映的什么事?

在比赛前、比赛后,我们对机器的理解里面产生了巨大的变化,我们开始接受它,开始把它拟人化,而且比分很巧妙,4:1,如果赢五局可能就不好了,不是围棋选手被灭了,是人类被灭的感觉。带来人和人平等的关系开始建立,印刷术建立之后,我们开始探讨人和人之间的关系。后来我查史料,文艺复兴这样一个运动,它其实是从封建社会到资本主义社会之间的一个分水岭。咱们中国现在还没经历这个运动,所以有一点点问题。但是AlphaGo之后,我觉得今天带来我们重新的思考,就是机器和人的关系,去思考这个事情,有专家会讲机器还不行,但是有人讲机器以后会颠覆人类,我们开始思考这个问题,以前认为机器就是机器,拔电源就行了。诊断报告是机器给做的,说你这个人有什么问题,看片子看得怎么样,找专家、找人。但是在今天照片子之后,机器给你诊断效果可能是比人更准的。我有一个朋友,也是清华的一个同学,他就是做CT看片子的,做乳腺看片子,他说大多数医生看片子准确率是40%,他现在到70%,已经高很多了。我们今天接受机器在里面能做很多的判断。这是我们巨大的一个心理上的变化,我把它称为“第二次人类自己的运动”。

对于机器智能,大家讲了很多了,有各种专业的方法,包括怎么定义人工智能,我们做产品的时候,就是想机器怎么能在里面做决策、做识别,目的还是希望能够做决策。从做决策这件事情里面就分了三个层次。

第一层,将传统方法交给机器。第二层,将答案交给机器记忆学习。第三层,将目标给机器自我学习。

这是我自己的理解,也是跟AlphaGo脉络一致的,其实最早的专家系统就是第一个,我们把规则交给机器,我们不管提符号主义,我们就把是把计算机世界变成一个逻辑,告诉机器,这是原来的阶段。但是这个阶段里面重大的问题,如果我们自己会做,但是我们没法去教机器,我们不知道怎么描述的时候,这个机器就不灵了,而且教出来的徒弟永远是比人弱的,这是不够的地方。甚至我们在做一些学习系统,我们也要尝试告诉机器怎么去描绘一个实物,比如说做人脸模型,王小川长成这样,大家都认识,但是要描述出来,比如说脸很圆,这个事情也比较不靠谱。因此我们发现我们没法告诉机器,有了深度学习的方法以后我们确实解决了一个问题,就是只告诉机器答案,我们给他的数据越原始越好,这件事情会使得程序员、工程师更容易应对专业的问题。因为它可以减少自己的专业背景,不用讲说我要去懂人,或者我要像医生一样懂得这个片子怎么看,他是拿数据训练的。所以在这样一个深度学习或者是人工智能发展过程中间,由于深度学习本身带来了好处,技术人员更容易进入到专业领域里面破解题目,但是这是技术本身。但是对公司而言,公司的领头人一定是对行业理解比较深刻,对行业应用的时候必须很懂,这是我们讲的第二个侧面,我不用给机器方法,我给机器答案,机器自己找方法。

AlphaGo代表一个趋势,我之前跟微软也在聊这方面,既不给你一个规则,也不给你一个答案,我把自己变成一个判断者,就像下围棋一样,围棋之前训练的时候,前三盘棋是把人之前的走棋方法告诉机器,机器就是跟人处于类似的状态。之后是机器人自己下,我也不知道哪个棋好不好,但是下完之后,人告诉机器这个结果是好还是不好的。人工智能又得到一个新的法门,答案都不需要知道,变得更加省事。

最近有一个消息应该是比较靠谱的,AlphaGo在今年内会跟柯洁打一场比赛,我跑去看了很多评论,以前是一边倒觉得人会赢,今天一边倒觉得机器会赢。在座的各位觉得柯洁会赢的有吗?还有是吧?这是缺乏判断力的表现。但是我会猜想Google会干什么新的事,不是简单地下棋。我有一个猜想,我认为这一次跟柯洁比赛的AlphaGo是没有经过那三千万盘棋学习的,因为之前是从KGS里面拿了人六段到九段的走棋,让机器在里面学习,这是跟李世石打比赛用到的。但是跟柯洁比赛我认为是新的,就是两个从来没有学习过的机器,然后告诉你赢了、你输了,什么都不会的机器训练一个下棋的规则来,跟柯洁比,如果是所料的这样就会非常好看,因为以前的机器是仿人的,甚至我们判断机器走棋走得好不好都是我们的经验去判断它。下棋的时候,头两局机器赢了,人输了,媒体的报道说法是中盘逆转,为什么叫中盘逆转?是因为前一半里面专家态度就是机器走得特别臭,走到一半的时候,发现机器越到中局的时候越好了。这个时候就觉得机器是翻转局面了。但是后来数据统计,包括Google自己说的,其实不是,在他们的视野里面,机器一直是领先的,只是以人的眼光觉得机器走得很差,以机器的眼光,它自己走得挺好的。

所以我们对机器的理解是有限的,因此如果机器根本没跟人学过完全自己的经验,这次就会有很多新的方法出来。比如慕容复中原的武功学会,然后再去修炼,突然来一个西域的,或者没有跟中国比赛过的,没有学过围棋打法的,我们会遇到这样的一个问题。因此我内心中,是否用这个程序参加比赛是我的猜想但是Google尝试不用人训练机器,我蛮佩服的。就好像再重演一次人类的进化史。

我们会好奇哪些职业会被取代,倒过来讲就是哪些行业是创业的机会?其实下围棋的程序,如果把程序突然间跟AlphGo说,对不起,我们改点规则,我们把棋盘放成21×21,放大两个,机器肯定就不会下棋了,但是李世石一定会下。所以机器能做的事情是非常非常有限的。如果说这种题目非常地清晰,就像下围棋一样的,输入的信息就局限在有限的输入里面,在有限的输入下,有规则清晰的输出,在这种情况里面,机器都会把人给取代。所以任务的确定性高,输入的信息封闭有边界,输出答案是标准可评价的。为什么呢?棋手已经有了,或者医生、司机、股票的高频交易,像这种情况下输入的信息非常有限,在信息非常有限的情况,机器就把人给应了,因此这里面是机会。难被取代的行业,像创造性的东西,画家、作家、科研,因为你这样一个思考的问题是没有一个边界的,对机器而言,今天是完全找不到机会去努力的。分析一下哪个行业让机器更有机会参与,让人做哪些行业。

技术人员而言,今天发现自己不再是代表人的一方,而是代表让机器更加聪明,能够提高机器的效率,能够看到更广阔的前景,尤其是做搜索的公司,做人工智能好像更有优势,为什么?因为有很多的数据,比如像芮勇讲的要做数据的时候,搜索摩托车,找图片,没找到就不会点击了,用户的点击都会反过来给图片做标签。更多的是搜索引擎本身就在做初步的人工智能。因为我们看到给你一个关键词你要理解想要什么,随后能够给它十条答案。我在理解里面,人工智能就是底层的基本理念,完全是一致的。

今天我们看到Google往前走的时候,已经开始提更多的理念,他们已经开始在讲说已经从移动时代走向人工智能的时代。乔布斯也想得很明白,在走之前说机器能够在未来学会回答问题,或者接受你的指令去做事。机器里面是这样一个辅助的角色,但是很不幸,苹果的技术能力不够,或者是时代没有到,理念很好。

微软题的一个概念也是做这个事。当然现在很多了,包括Google、亚马逊,大家都开始让人跟机器以自然语言做沟通,机器服从于人,帮你回答问题,或者是帮你做一些控制命令。这是整个大的背景。我自己也觉得今天我们提互联网已经不提连接,一方面是文化创意产业,一方面是机器变得更聪明,因为有了数据以后,怎么选择这个连接,做判断就变得更关键。

这儿有一个小的视频,这是我们公司现在想做的事。

王小川:我的演讲就到这里,谢谢。

王小川,搜狗公司CEO,前搜狐高级副总裁、首席技术官。1994年王小川用吴文俊消元法,首次在微型机下完成初等几何命题的全部证明。1996年王小川代表中国队参加第8届国际信息学奥林匹克竞赛(IOI),获得金牌,后为中国队教练。2015年,王小川以“群体智能支撑的互联网技术及应用”科技成果获得北京市科学技术奖一等奖;获得了科技北京百名领军人才、推动“北京创造”的10大科技人物奖、以及北京市劳动模范称号。此前王小川还入选了2014年北京市高层次创新创业人才计划,并获得了2014年安永中国新兴企业家奖等多个奖项。2016年王小川代表搜狗捐赠清华大学1.8亿元成立“天工智能计算研究院”,共同致力于人工智能前沿技术的研究。王小川先生毕业于清华大学计算机专业,拥有工学学士、工学硕士,以及EMBA学位。

来源:数据派

微信ID:datapi

原文发布于微信公众号 - 大数据文摘(BigDataDigest)

原文发表时间:2016-06-09

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏大数据挖掘DT机器学习

评《大数据时代》一点笔记和一些琐碎的感想

《大数据时代》是国外大数据研究的先河之作,本书作者维克托•迈尔•舍恩伯格被誉为“大数据商业应用第一人”,拥有在哈佛大学、牛津大学、耶鲁大学和新加坡国立大学等...

39460
来自专栏大数据文摘

人类历史上最有影响力的5张信息图

358100
来自专栏纯洁的微笑

人工智能发展史

我一直很好奇人工智能是如何提出来的,它背后有什么样的故事,在人工智能发展的这60年的时间中,又经历了什么?为什么现在才是人工智能的爆发点,未来人工智能又将走向何...

576110
来自专栏机器人网

横扫棋坛后,AI机器的下个目标是征服翻译界

如果你的朋友圈有一位人工智能行业的创业者,你可能会有些焦虑,因为他可能会隔三差五地转个文章告诉你哪些行业要灭绝了。礼拜二,阿尔法狗「胜天半子」的时候大家也都很慌...

37560
来自专栏AI科技评论

从颠沛流离的波士顿动力说起:多足机器人的路为什么越走越艰难?

今年8月,雷锋网将在深圳举办一场盛况空前有全球影响力的人工智能与机器人创新大会。届时雷锋网(搜索“雷锋网”公众号关注)将发布“人工智能&机器人Top25创新企业...

426160
来自专栏吉浦迅科技

赢了围棋还能做面包?深度学习能够为您的企业带来什么好处?

您也许不是 F1 赛车的狂热车迷,但是,很难不去欣赏这样迷人的机器。流线造型、美丽车身、疾速飞驰、全车充斥着迷人的科技,甚至巴望着自己狭窄的小车也能有一点点的相...

34150
来自专栏大数据文摘

数学恐惧症?不会睡着的数学书了解一下!

14460
来自专栏量子位

“Google只认钱!机器学习20年没进步”,CMU学者炮轰AI第一大厂

14630
来自专栏企鹅号快讯

斯坦福发布首份 AI Index 报告,AI 研究者不再茫然

前不久斯坦福大学计算机科学教授,前谷歌首席科学家 Yoav Shoham 来到中国做了场《人工智能的过去、现在和未来》的报告,对人工智能的发展历史、现在所面临的...

22550
来自专栏PPV课数据科学社区

吐槽版评《大数据时代》一点笔记和一些琐碎的感想

? 我觉得维克多的“相关关系比因果关系更重要”指的应该是以数据预测为目的的时候,不应该过于看重去通过找寻数据产生的关联性的原因然后去推测规律,而是直接把相关性...

26650

扫码关注云+社区

领取腾讯云代金券