哈萨比斯首次解读AlphaZero竟被当场diss,他起身当面回击说…

夏乙 假装发自 长滩 量子位 出品 | 公众号 QbitAI

有争论才有意思。昨天是机器学习“炼金术”,今天则是AlphaZero。

在NIPS大会期间,DeepMind创始人兼CEO哈萨比斯(Demis Hassabis)出席了自己赞助的一个研讨会。在这个活动上,哈萨比斯首次公开解读了他们最新的研究成果AlphaZero

哈萨比斯在演讲中首先提到DeepMind背后的哲学,这家公司奉行的第一性原理。回顾了AlphaGo在此前比赛中的表现,特别是那些具有“独创性”的时刻。

至于最新的AlphaZero,哈萨比斯坦言结果出乎他们预料。DeepMind本来认为手动调整的国际象棋引擎Stockfish已经接近最优解,但没想到AlphaZero还是在24小时之内,通过不断地自我对弈,最终击败了Stockfish。

当然不只是击败了一个国际象棋程序,AlphaZero还横扫了日本将棋程序Shogi,以及刚刚创下佳绩的围棋程序AlphaGo Zero。

在国际象棋比赛中,AlphaZero的棋风,既不像人、也不像电脑。

哈萨比斯介绍说,AlphaZero偏爱远期的局面性弃子,没有子力的概念。AlphaZero会根据当前的局面进行判断,相较而言,如果使用了刚性规则就无法动态调整策略。人类可以向AlphaZero学习国际象棋的战略,而不是战术。

当然,哈萨比斯也没忘了问一句:人类关于国际象棋的知识是不是太有限了?(╭(╯^╰)╮)

说句题外话,关于这次的AlphaZero,固然又给DeepMind挣了脸,但是奇怪之处在于,有关AlphaZero的研究,论文只在arxiv上“草草”发出了事。

既没有发Nature,也没有投会议。甚至DeepMind官方博客、推特等渠道,也没有专门发文提及此事。

这不像DeepMind既有技术,又擅长“炒作”的风格呀……

马库斯当场Diss哈萨比斯

安妮薇,对于DeepMind最新搞出的AlphaZero,有人溢于言表的赞美。当然也有人一万个不爽。

比方,纽约大学的马库斯老师(Gary Marcus)。他是纽约大学心理学和神经科学教授,所涉猎的领域包括人类和动物行为、神经科学、人工智能。马库斯还曾担任Uber AI实验室的负责人(主要他的AI创业公司被Uber收购了)。

哈萨比斯讲完后不久,马库斯登台。他很快指出:DeepMind令人惊叹的结果,仍然依赖于一些人类知识,比方使用了蒙特卡洛树搜索。

接着,他提出一个“理论”:认知(Cognition)可以视为三个变量的函数,写成公式就是:Cognition = f (a,k,e)。其中a代表先天算法,k代表先天知识,e代表经验。

“DeepMind已经非常令人信服的表明,即便k值接近于0(zero),也能获得出色的认知表现”,马库斯表示。

不过你有没有发现,马库斯实际上用公式写了一个大大的单词:f a k e。

马库斯对于DeepMind以及AlphaGo的主要抨击点在于,哈萨比斯等人的工作,低估了对人类知识和特定领域的需求。

马库斯主张人类拥有先天的知识,而神经网络基本不具备。他认为在特定领域的专长,不等于先天性。他举了几个例子,例如膝跳反射、人脸识别、国际象棋都是特定领域的能力,但先天性方面各自不同。

而通用智能不分领域,有部分是天生的。

马库斯指出,如何认知对象等等能力,可能都是进化所赋予人类的天生能力(当然也有观点说这些都不是天生的)。

“生命不是一场Kaggle竞赛。”

马库斯表示,生命是一场训练集(training set),没有什么是预先准备好的整齐数据,很多情况都无法预测。在这个过程中,每天的挑战都不一样,真正应该重视的是那些可以用在多个领域的知识。

哈萨比斯当面回击

其实马库斯有点看什么都不满意的习惯,之前马库斯还跟LeCun等人公开叫板。只不过这一次,他diss的对象,就坐在台下。

于是最劲爆的一幕出现了。

哈萨比斯听完马库斯的一番言论,然后当场起身开始了回击。哈萨比斯表示,DeepMind并不是反对先天知识,他们方法已经远超完美信息博弈的范畴,而且整合了神经科学、认知心理学的原理。

哈萨比斯的回击,这有段视频,可以感受一下:

OMT

关于AlphaGo、AlphaZero的争论,让量子位想起不久前看到的一篇论文。论文的题目是AlphaGo祛魅:Demystifying AlphaGo Zero as AlphaGo GAN

这篇论文的作者是南京东南大学的几位学者:

  • 董晓,副教授,影像科学与技术系
  • 伍家松,讲师,影像科学与技术系
  • 周玲,副教授,计算机工程系

他们在这篇论文中指出:

AlphaGo Zero的惊人成功,在全球范围内引发了对人类社会未来的讨论,期间夹杂着希望、焦虑、兴奋和恐惧混合的情绪。 我们尝试对AlphaGo Zero去魅,通过定性分析表明AlphaGo Zero可以被理解为特定结构的GAN(生成对抗网络),这个系统本应具有良好的收敛性。 因此,我们认为AlphaGo Zero的成功,可能不是新一代AI的标志。 可能影响AlphaGo Zero性能的因素包括:1、围棋的固有属性;2、AlphaGo Zero的结构(基于ResNet的价值和策略网络,MCTS和强化学习)。 这篇论文中,我们通过指出AlphaGo Zero可以被理解为一个具有良好收敛预期的特殊GAN,来试图定性的回答这个问题。

如果你对这篇论文感兴趣,可以在量子位微信公众号后台回复:“祛魅”两个字,就能获得相关的下载地址。

文中的现场图文、视频来自推特账号:@thinkmariya、@willknight等。

原文发布于微信公众号 - 量子位(QbitAI)

原文发表时间:2017-12-08

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏大数据文摘

一份AI博士生的ICML2018“学霸”笔记(55页)

7 月 10 日,第35届机器学习技术国际会议ICML 在瑞典斯德哥尔摩举行,作为AI领域最负盛名的会议之一,本次会议共收到2473篇论文。其中,621篇被接收...

10600
来自专栏新智元

又输了!中国五位大神吊打,Open AI挥别Dota2赛场!

昨天第一场比赛输了之后,在今天Ti8表演赛中,OpenAI Five战队再次与人类交锋。

8510
来自专栏ATYUN订阅号

AI在Dota2的5v5比赛中战胜顶级玩家,并计划进军Ti8

此前曾在Dota 2中击败人类(4000分)的人工智能机器人OpenAI Five今天更进了一步 ,成功击败世界排名99.95%以上的半职业Dota 2玩家(7...

6910
来自专栏大数据挖掘DT机器学习

难以解释的数据异常

在分析数据的时候,总有那些一些数据异常无法找到适当的理由进行合理解释,也许可以换个角度来看待这些异常。为什么明明数据发生较大的起伏波动,我们绞尽脑汁还是无法...

34860
来自专栏机器之心

毫无还手之力!OpenAI人工智能5v5击败超凡5玩家(6600水平)

2017 年 8 月,OpenAI 在 Dota2 TI 决赛现场以 1 对 1 solo 的方式击败了「Dota 2」世界顶级玩家。今年 6 月份,OpenA...

8610
来自专栏机器之心

现场报道 | 面对最菜TI战队,OpenAI在Dota2上输的毫无还手之力

据介绍,本届 TI8 的很多参赛队伍都报名想参加与 AI 的比赛,OpenAI 今天遇到了第一个对手:来自巴西的战队 paiN,后者也是本届 TI8 比赛第一支...

15610
来自专栏企鹅号快讯

人工智能那么厉害,能算出彩票中奖数字吗?

众所周知,目前的人工智能已经逐渐被广泛应用,它能做人做不了的事情,大量的岗位也会随着人工智能的发展被替代,那么人工智能那么厉害,能算出下一期的彩票中奖数字吗?这...

36750
来自专栏ATYUN订阅号

【学术】新的研究旨在解决黑箱算法中AI产生的偏见问题

从选择股票到检查X光,人工智能正越来越多地被用于帮助人类做决策。但是人工智能只能对它所训练的数据做出好的反应,而且在很多情况下,我们最终会把太过人性化的偏见放到...

30340
来自专栏VRPinea

除了直播,VR+体育还有哪些打开方式?

35640
来自专栏吉浦迅科技

乐见人工智能:深度学习如何用于检测眼疾

很多老年人都会有眼睛黄斑部退化(又称老年性黄斑部病变)的毛病,会让视力开始变差,双眼中央视野模糊;最早还能使用倍数更高的放大镜来阅读,但到最后可能都看不清他人的...

367110

扫码关注云+社区

领取腾讯云代金券