前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >NYU心理学教授:深度学习狂热正把人工智能引入歧途

NYU心理学教授:深度学习狂热正把人工智能引入歧途

作者头像
量子位
发布2018-03-22 14:57:09
5060
发布2018-03-22 14:57:09
举报
文章被收录于专栏:量子位
李杉 编译自 TechCrunch 量子位 报道 | 公众号 QbitAI

如今,只要访问科技网站,几乎不可能看不到跟深度学习有关的文章,似乎人工智能即将解决我们的所有问题。但Gary Marcus仍然表示怀疑。

Gary Marcus

Marcus身兼畅销书作者、创业者、纽约大学心理学教授等多重身份。这位曾经花了好几十年研究儿童学习方式的学者认为,单纯凭借更多的数据未必能在语言理解等领域实现进步,更不用说实现通用人工智能(AGI)了。

在人工智能红得发紫的今天,Marcus的声音显然有悖潮流。

他在2015年将自己的想法变成了一家创业公司——Geometric Intelligence。这家公司希望利用认知心理学方面的研究开发出效果更好、数据需求量更小的机器学习系统。该团队已于去年12月被Uber收购,负责运营Uber的人工智能实验室。Marcus的创业伙伴Zoubin Ghahramani如今已经被任命为首席科学家。这家科技巨头为何如此看重该公司的技术呢?

Marcus接受博客节目Flux采访时,探讨了为什么人们拿到深度学习这个锤子之后,就会看什么问题都像钉子,以及他开发的这种稀疏数据模式为何很有价值。

他们还探讨了人工智能创业公司与谷歌这种财大气粗的公司竞争时所面临的挑战;为什么很多企业关注的人工智能方向并非社会所需;他对过时的图灵测试的调整建议;以及为什么让机器人理解“伤害”那么困难?

以下为对话概要:

:很多人都知道你一向喜欢批评这项技术,你认为人工智能炒得过热了,还说深度学习非常擅长那些可以轻松实现的目标:感知和分类等细分任务,也许还有下棋,但你觉得深度学习的狂热正在把人工智能引向错误的方向。

你认为我们没有在认知和强人工智能方面取得进展,或者如你所说:“我们本想开发一个机器人Roise,但却做出了一台扫地机器人。”

所以你主张重新引入心理学元素,因为人类有很多事情做得更好,我们应该研究人类为什么做得更好。

你至今仍对这一领域怀有这些想法吗?

:基本如此。可以轻易达成的目标可能比我的预期还要多一些。

我看到别人更加简明扼要地阐述了这个问题,简单来说,深度学习并不等于通用人工智能。你可以用深度学习做很多事情,比如提升语音识别效果,提高物体识别率,而这并不意味着智能。智能是一个多维度变量,其中牵扯很多问题。

最近在TEDxCERN上发表的演讲中,我做了这样一个饼状图,告诉人们:瞧,这就是感知,它只占很小一部分。这是很重要的一部分,但人类的智能还包含其他许多因素,比如我们在同一时间参与正确事情的能力,我们推理事情、建造模型、预测未来的能力。感知只是其中的一部分,而深度学习其实只是在帮助这一部分。

我2012年在《纽约客》杂志上撰文称,这很好,但却并不能帮助我们解决对因果关系的理解,对语言的理解也无法带来帮助。造出了一个更好的梯子并不意味着你能登上月球。

我至今仍然怀有这种想法。我仍然认为我们距离月球很远。要真正登月,就要开发出一种像人类一样灵活的智能。与4年前相比,我们与这个目标的距离便没有缩小。

社会各界对人工智能都兴奋不已,这是它应得的。人工智能第一次成为一项实用的工具,这是好事。企业有足够的理由向这些领域投入资金。

可是看看无人驾驶汽车吧,这的确是一种智能,那就是一种很平庸的智能。只要头脑清醒,16岁的孩子经过几个月的培训也能开车。但谷歌开发这项技术已经7年了,但却只能在晴朗的天气里开车,而且交通不能太拥挤……

:深度学习是不是还有一个黑箱问题?我们并不知道深度学习的内部运作状况,它很神秘。这对无人驾驶汽车这类东西来说难道不是个大问题吗?

:确实是问题。至于究竟能否克服,还要看经验。

至少从现在看来,我们无法很好地解释人工智能所作的事情。所以可以这样来看这个问题,你有数百万个参数和数据点,因此作为一名这方面的工程师,我必须应对基于这些数据生成的数百万或数十亿的数字,而这其中或许蕴含着一些规则,但不够清楚。从理论上看,完全可以认为你永远无法真正找出可以解释的答案。

现在有一种观点认为,我们在90年代从事的一些研究探讨了深度学习是否仅仅是一种记忆。有的论文认为是,有的认为不是。它并不是记忆,但有点像。如果你记住所有的例子,或许没有一种抽象的规则来描绘所有的事情,但或许很难说那里有什么。

所以,如果你完全使用深度学习开发自己的系统,就像英伟达鼓吹的那样,出错的时候就很难知道发生了什么,所以很难排除故障。

:如果你的车撞上了路灯杆,但你却无法知道背后的原因,那就很成问题。

:如果只是路灯杆,而没有太多人受伤的话,那还算幸运。这里面蕴含着很大的风险。已经有人因此丧命,尽管我认为特斯拉的事故中使用的并不是深度学习系统,而是另外一种不同的系统。我们在这两端的技术方面都面临问题。

所以,我不想说经典的人工智能已经完全解决了这些问题,它并没有。我认为现在还没有成熟,人们应该重新讨论这个问题。但事实上,我们并没有好办法来开发真正复杂的系统。思维就是非常复杂的系统。

:你觉得大平台为什么正在围绕人工智能,特别是深度学习进行重组?仅仅是因为他们获得了数据护城河吗,所以是不是说如果你也能得到这些数据,同样会进行很好的训练。

:谷歌有很多数据,他们肯定希望利用这项优势。谷歌有能力开发新的资源,免费提供出去。他们还针对自己的问题开发各种资源。所以,如果谷歌利用这些庞大数据指导他们自己的人工智能,我又怎么能利用这些数据呢?

从他们的商业利益角度来看,这的确有意义。但从社会角度来看,却未必如此。社会需要人工智能吗?应该怎么做?这是最佳开发方式吗?

我认为,如果你询问这些问题,你可能会说,社会最需要的是自动化的科学发现,从而帮助我们真正了解大脑,治愈神经疾病,帮助我们理解和治疗癌症,诸如此类。

如果这是我们最期待用人工智能解决的问题,我认为我们会说,不要完全让这些公司来解决这些问题,而是应该组建一个类似于CERN这样的组织。这需要70亿美元。如果你有70亿美元,并且小心翼翼地向着共同目标努力,会怎样?可以想象,社会会采取这样的方法。考虑到目前的政治环境,应该不会很快发生这种事情。

:大公司们至少在为了AI的道德准则而合作,这是个开始。

:人们讨论道德问题是件好事,的确有一些严重问题值得考虑。我想说的唯一问题是,有的人在夸大其词,认为真正的人工智能即将到来,但恐怕不是。我认为可以现在开始思考这些问题,即便真正的人工智能比人们想得更加遥远。如果这能激励人们采取行动,大概需要20年,但行动本身也要20年,所以现在很适合开始思考这个问题。

:我想回到你的人工智能实现方案上,你为什么认为这很重要?

你给出了你认为更好的范式,灵感来自认知心理学。你认为你的算法速度更快、效率更高、数据使用量更少、也更不容易出问题,应用范围也更加广泛。

在很短的时间内,你已经取得了不俗的早期结果。你还运行了许多图形识别测试,证明了你的算法比现有技术表现更好,使用的数据更少。

所以,深度学习在拥有共同例子和高频内容的海量数据时表现很好。但在现实世界中,多数情况下都是长尾任务,没有太多数据。那么,虽然神经网络或许擅长低水平的认知,但他们并不那么擅长理解综合性的事情。

能否再多谈谈你的方法,以及你在认知神经科学方面的训练带来了什么启发?

:我师从Steve Pinker,在学习中,我发现人类儿童非常擅长学习语言,就算他们还不擅长其他事情。当然,我是作为一名研究生学到了这些,我现在也有了自己的孩子,一个4岁,一个两岁半。他们的学习速度的确令人惊讶。

:你见过的最好的人工智能是什么?

:事实上,我儿子跟伟大的机器人学家Rodney Brooks同一天生日,有一段时间,我每年都会给Rodney发一封电子邮件,跟他说:“生日快乐。我儿子现在一岁了。我认为他可以做到这些事情,而你的机器人做不到。”这像是我们两个人之间的玩笑。

:他现在远超所有机器人了。

:我今年甚至都不考虑这个问题了。4岁的孩子掌握的马达控制和语言能力远超机器人。所以我开始思考90年代初的那种问题,而我从未真正找到答案。但我创办公司的部分动机在于,如果你有很多数据,就可以提供这些非常擅长学习的系统,有很好的效果。

我们举个语音识别的例子,如果要解决白人男性在安静的房间里说出搜索词的问题,经过标注的数据你要多少有多少,在建立机器学习系统时,这些数据非常关键。但我的孩子不需要这些,他们没有标注过的数据,没有海量的数据,他们只要观察世界,就能把这些事情搞清楚。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2017-04-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 量子位 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 李杉 编译自 TechCrunch 量子位 报道 | 公众号 QbitAI
    • △ Gary Marcus
    相关产品与服务
    语音识别
    腾讯云语音识别(Automatic Speech Recognition,ASR)是将语音转化成文字的PaaS产品,为企业提供精准而极具性价比的识别服务。被微信、王者荣耀、腾讯视频等大量业务使用,适用于录音质检、会议实时转写、语音输入法等多个场景。
    领券
    问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档