LeCun列传:曾因AI理论遭人唾弃,如今终成一代大神

李杉 陈桦 若朴 编译自BuzzFeed 量子位 出品 | 公众号 QbitAI

距离Facebook门罗帕克总部约3000英里之外,在曼哈顿市中心一栋老旧的米色办公楼里,有群人正在从事一个十分超前的项目。虽然该项目由Facebook主导,但似乎跟社交网络关系不大,反而更像是科幻小说里的场景。

这个团队的全称是Facebook人工智能研究院,内部将其简称为FAIR,他们的目标只有一个:开发与人类的智能比肩的电脑。虽然距离目标仍有很长距离,但该团队却取得了惊人的成就:他们的人工智能程序可以绘制出几乎与人类艺术家媲美的绘画,还能参加基于维基百科上的问题所展开的测验,甚至还会玩《星际争霸》这样的高端游戏。

今后,它们还会更加聪明。有朝一日,甚至能将Facebook从好友之间的互动平台变成你的知心好友。

正是出于这种原因,FAIR并非典型的Facebook团队。他们的成员并没有直接参与这家社交巨头的日常产品开发,例如Instagram、WhatsApp、Messenger和Facebook本身。其终极目标可能要等到几十年后才能实现,也有可能永远无法实现。

另外,该团队的负责人也并非传统的硅谷高管,而是56岁的学术大咖Yann LeCun。他人生中经历过惨痛失败,但最终恢复元气。他的人工智能理论曾经遭人唾弃,但如今却广受追捧,Facebook给出的高额薪酬便是他个人价值的最佳证明。

“你跟数字世界、跟手机、跟电脑的互动方式都会改变。”LeCun在接受BuzzFeed News采访时说。

FAIR正在改进计算机的视觉、听觉和沟通能力,而他们的成果也已经渗透到Facebook的产品之中,从News Feed排序算法到相机和照片滤镜,可谓无孔不入。而Facebook也在展开大举投资——不仅仅是因为人工智能非常有趣,更重要的是这项技术非常必要。

在当今科技行业的每个角落,企业都在人工智能领域展开竞争。Uber的人工智能无人驾驶汽车成为其专车战略的核心。谷歌的人工智能Google Home智能音箱则希望回答原本通过搜索框提出的问题。亚马逊甚至在自营便利店里配备了人工智能收银员,希望借此撬开6740亿美元的杂货市场。

而在Facebook,人工智能早已无处不在。例如,该公司基于人工智能开发了照片滤镜,可以帮助其应对Snapchat的挑战。该公司还利用人工智能查看图片,判断图片中的内容,甚至决定在你的信息流中展示哪些内容,这些措施都可以提供一流的体验,从而增强用户粘性。他们还利用类似的技术监控骚扰、恐怖和色情内容,并通过添加标签的方式将其删除。

“人们在Facebook整套产品上获得的体验高度依赖人工智能。”Facebook应用机器学习事业部(AML)负责人Joaquin Candela说,“现在看来,没有人工智能,Facebook就无法生存。”

随着人工智能技术的进步,Facebook也将依赖LeCun和他的团队在竞争中保持领先地位,应对可能拥抱这项技术的各路对手。

虽然遭到了长达数年的批评和排挤,但LeCun终成正果:他手下现在拥有80名研究人员,还获得了Facebook的巨额财务支持,他本人的工作也得到了主流社会的认可。他现在的任务就是努力工作,实现目标。

视觉

从年轻时代开始,LeCun就相信计算机能获得视觉。今天,面部识别和图像识别或许已是常规技术。然而,当80年代LeCun在巴黎读大学时,计算机就是瞎子,无法识别图片中的内容,也无法判断摄像头前方出现了什么。LeCun在大学里偶然涉足了探索人工智能领域的一种方法,而这种方法自60年代以来就没能取得太大发展。当时他认为,这种方法“将帮助机器学会掌握多种任务,包括感知”。

这种方法被称作“智能神经网络”,利用了由多个互联传感器构成的系统,将图像等内容分解成为很小的部分,进行模式识别,并根据这些传感器的共同输入判断看到了什么。在阅读了关于神经网络的反对意见(例如训练非常困难,性能不够强大)之后,LeCun决定推动这项研究。在攻读博士学位的过程中,他在一片质疑声中专注于智能神经网络的研究。对于批评的声音,他表示:“我只是不相信他们所说的。”

在人工智能领域,困难时常出现,并且难以解决。这样的时期也得到了一个专属称呼:“人工智能的寒冬”,即研究人员取得的成果无法达到最初设想,令外界感觉科学似乎不可靠,并进而导致对人工智能的兴趣和投资下降,技术进步趋于停滞。

LeCun也看到了“人工智能的寒冬”。在90年代中期加入贝尔实验室从事人工智能研究之后,AT&T的内部矛盾导致了他的团队分裂。当时,他们推出了能读取支票的ATM机,目前这种基于神经网络的技术仍在使用中。LeCun认为,这是这项技术明确的进步。他表示:“在取得真正成功的那一天,整个项目被解散。这令人非常沮丧。”

与此同时,其他人工智能技术获得了主流研究人员的关注。这些方法随后逐渐失去了青睐,但它们的发展足以导致神经网络,以及作为这一领域权威人士的LeCun被边缘化。00年代初,其他学术机构甚至不允许LeCun在它们举办的会议上发表论文。神经网络先驱、谷歌的工程专家、多伦多大学教授Geoff Hinton表示:“计算机视觉圈子拒绝了他。外界的看法是,他在坚持从事80年代时看起来很有前景的工作,但目前他应该放弃这方面的工作。”

他指出:“现在的看法已经不再是这样。”

其他神经网络的研究者也遇到了类似问题。蒙特利尔大学教授、蒙特利尔学习算法研究所负责人Yoshua Bengio发现,他很难找到愿意与自己共事的研究生。“我需要强迫学生从事这方面的研究,因为他们害怕在博士毕业后找不到工作。”

2003年,LeCun为自己的重生打下了基础。这年,他加入了纽约大学,并与Hinton和Bengio结为了非正式的合作联盟,复苏对神经网络的研究。LeCun表示:“我们启动了所谓的‘深度学习阴谋集团’。”

随后,“深度学习阴谋集团”在神经网络的研究中扮演了关键角色。这一联盟坚持最初的信念,即与其为希望识别的每种不同对象开发专门的神经网络,你可以使用共同模板开发单一的神经网络,识别图片、视频和语音。换句话说,你没有必要开发两个神经网络,分别识别企鹅和猫的图片,而是可以使用统一的神经网络同时识别两者,并找出其中的差异。这种新的神经网络也可以胜任其他任务,例如观察声波,探测语音中的模式。

“深度学习阴谋集团”的研究获得了两大外界因素的帮助。一方面,计算机性能大幅提升,这使得神经网络的运行速度足够快,从而可以应用于实际。另一方面,由于互联网的普及,可用数据,包括图片和文字,获得了指数式的增长,这将帮助神经网络变得更智能。最终,神经网络成为了一种快速而准确的方法,给人工智能带来了全新的可能。

由于LeCun及其合作伙伴打下的基础,计算机视觉技术在进入10年代之后得到了快速发展。最初,计算机可以识别图片中的对象,然后是视频,随后又拓展至摄像头拍摄的实时画面。目前,当你用摄像头指向一个篮球时,人工智能可以知道前方是什么。LeCun迅速从人工智能的边缘人物变为了行业的领导者。他表示:“原本没有任何人从事这方面的研究,而在一年时间里所有人都在开展研究。真是疯了。”

2013年12月,LeCun加入了Facebook。对希望将人工智能技术应用于照片的研究者来说,Facebook带来了理想的研究环境。Facebook平台上有数十亿张图片,这给LeCun及其团队提供了丰富资源。Facebook人工智能研究所常常与应用机器学习部门展开合作,将研究成果以适当的方式应用于Facebook平台。双方共同开发了新系统,在Facebook公司范围内带来技术进步。应用机器学习部门会利用Facebook人工智能研究所的成果来识别用户消息流中的内容,以及让Facebook相机应用根据用户表情来制作不同特效。

思想

在帮助机器了解世界是如何运转的过程中,给计算机提供视觉只是第一步。人类能理解世界的运转方式,因为我们不断重复地看到各种场景,进而了解到这些场景的演化过程。例如,当汽车冲着我们开过来时,我们会知道汽车将撞上我们,因此会让开。在天黑之后,我们知道打开灯开关将带来照明,因此会打开开关。

以类似人类的方式,Facebook人工智能研究所尝试教会计算机预测结果。LeCun表示,团队向人工智能展示了许多具有相关性的视频,随后在某个点暂停视频,让机器预测接下来会发生什么。例如,如果你重复向人工智能系统展示一段视频,视频中内容是水瓶在某人头上打翻,那么人工智能将会预测,随后的结果是这个人全身被淋湿。

LeCun表示:“在某种程度上,智能的本质就是预测。如果你可以预测行为将导致什么结果,那么就可以做出计划。你可以计划一系列行为,从而达到特定的目标。”

目前,教会人工智能预测能力是这一领域最复杂的挑战。这主要是由于,在许多情况下,多个可能的结果都是正确的。

LeCun表示,可以想象一支笔垂直悬挂桌面上,随后放开这支笔。如果你询问计算机,1秒钟后这支笔将会位于何处,那么并没有一个准确答案。机器会知道,这支笔将掉落下来,但并无法预测最终落在哪里。你需要告诉系统,这样的问题有多个正确的答案,“最终发生的结果是多个可能的选择之一。这就是在不确定情况下做出预测时存在的问题”。

帮助人工智能理解不确定性是“无监督学习”的一部分。目前,这也是机器学习的最前沿领域。当人工智能观察到足够多的信息,知道世界的运转方式,并且能够预测未来将发生什么时,其思维方式将更类似人类,获得人类的常识。LeCun认为,这将是让机器变得更智能的关键。

LeCun及其团队知道,人工智能完全掌握这种技能还需要很多年时间。不过他们相信,这一目标终究会实现。LeCun下属的研究经理Larry Zitnick表示:“这终将发生,但我会说,这需要超过10年的时间。”

语言

去年12月,扎克伯格对外展示了他的AI管家:Jarvis。这个小扎自己动手搭建的人工智能助手,可以用来烤面包,让他父母可以刷脸进家门,还能教小扎的女儿Max学习中文。

Jarvis很酷。但在LeCun看来,这没什么特别的。“它主要是用脚本写的,比较简单。而且智能程度很低,从某个角度来看”,LeCun评价道。

他的眼光在更高处。

LeCun想要构建的智能助手,需要真正懂得你在说什么。“(这是一种)可以进行谈话的机器”,他补充说“可以提前计划的机器,不会蠢到让你生气的机器”。

建造这种机器没有蓝图,不过FAIR正在为此构建基础部件。其中一个部分,是让AI对世界有初步的了解,对它进行训练,并且让它预测可能发生的情况。FAIR在教AI读写的时候,也使用了神经网络。

对于电脑来说,图像是一组数字,语音也是一组数字,文本同样也是。因此LeCun等人可以使用神经网络架构来识别图像中的物体,语音中的单词,或者文本的主题。

AI仍然无法像理解图像那样理解文字,但LeCun已经看到未来Jarvis最终会变成什么样子。他理想中的智能助手,将具有常识并且能和其他助手进行沟通。例如,如果你想和朋友一起去演唱会,智能助手会基于你喜欢的音乐类型、日程表和可能性给出建议。

“机器需要考虑到现实世界的情况”,LeCun说这是一个挑战。“人类不能同时出现在两个地方,人类也不能在几个小时内穿越美国,想要安排好某人的生活,需要顾及到很多方面的事情,比方旅行的成本等”。

Facebook目前正在试验一个简单版本的智能助手:M。这一项目由Messenger团队运作,基于一些FAIR的研究成果。Facebook Messenger最近推出“M suggestions”,当用户对话时,M如果认为可以有所帮助,就会立刻介入对话之中。

比方说,当有人问“你在哪”的时候,M会在对话中弹出,提供给你一个一键分享位置的按钮。未来Facebook会把这一功能继续进行扩展。

Facebook正努力通过AI来理解各种含义,M只是其中一个应用,这家公司还在考虑把AI用在更多地方。甚至可能会用来一些Facebook备受争议的问题。

2016年的大选让外界开始关注Facebook的两极分化和虚假消息,然而在此之前,LeCun团队成员Y-Lan Boureau就已经开始研究利用AI在Facebook上创建更有建设性的对话。

既研究神经学又研究AI的Boureau,花了一个夏天来观察她的朋友在Facebook上和人互撕,没有一点兴趣听取反对意见。“如果能够理解他们心态背后的驱动力,意见如何形成,为何僵化和抱团等”,Boureau说“就能调解两个无法对话的人,这非常有用”。

Boureau想创造这样一个世界:在人们付诸行动之前,可以看到尽可能多的不同意见。在这个过程中,AI可以帮助从文本中找出模式,理解哪些环节出了问题,并且尽量让讨论回到正轨。

“如果我们更理解学习的过程,以及如何从数据中看到人脑中的信念,也许就能更容易理解如何进行更具建设性的对话”,Boureau说。

2016年美国大选之后,LeCun公开表示Facebook有技术能力使用AI过滤假新闻。有人觉得这个方式,还能用于解决美国两极分化的问题,但LeCun说这个任务最好留给第三方解决,而不是可能带有偏见的机器。

“AI可以扮演某种角色,但这是一个非常困难的产品设计问题,而不是技术问题”,LeCun说“我们不想把大众引向某种意见,我们想保持中立”。

现实

涌起的热潮对AI来说是危险的,LeCun深知这一点。现在我们就身处一次新的热潮之中。2013年第一季度,6个公司在财报电话会议上提到AI。而来自彭博的信息显示,2017年第一季度这个数字增长到244个。

谈到未来时,LeCun的措辞非常谨慎。“AI离我们的目标还非常远,还达不到我们想要的效果”,他说。事实上,正如LeCun警告的那样,人工智能还远远达不到人类水平的智能,或者说所谓的通用人工智能。

然而,有时候LeCun也无法抑制自己的热情。生成对抗网络让他特别兴奋,这一种相对较新的AI研究,有助于解决AI领域预测和不确定的挑战。这种技术让两个AI系统在互相对抗中不断提升,FAIR就曾利用这一技术训练AI画画。

在今年早些时候的一个会议上,LeCun给出了更进一步的展示:让AI根据一段视频,脑补出一段后续的视频,还得骗过另一个AI的法眼。LeCun在谈到对抗训练时说:“这是机器学习领域过去10或者20年来,最棒、最酷的想法”。

所以LeCun会继续在对抗训练中继续玩下去,不断扩展这一领域的边界。对于20年前就听不懂他在搞什么的人来说,LeCun已经走得越来越远。尽管AI还有很长的路要走,成功也无法靠一人之力,但在这个过程中你始终无法忽视LeCun。

“这感觉棒极了”,LeCun说。

本文分享自微信公众号 - 量子位(QbitAI)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2017-04-18

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏新智元

德勤 | 思维与机器:人工智能时代的预测之术

【新智元导读】预测对经济和社会极其重要。金融、医疗、政治以及反恐、自然灾害预防等等领域,预测都有着不可替代的作用。然而,此前的研究表明,即便是最顶级的专家,在预...

523160
来自专栏SDNLAB

震撼上线,人工智能在网络领域的应用与实践

作为一个诞生了60多年的词汇,人工智能的发展已经历过多轮起伏,现今这个阶段可以说是人工智能的黄金时期,全球的科技巨头都在AI领域频频布局,不同于单纯的炒作,此轮...

14220
来自专栏大数据文摘

[干货] 一个数据科学家的新年计划

175100
来自专栏CreateAMind

X君与C君关于空间智能重构与通用学习机的对话(之二)

文章中观点:在动物来说,记忆和分析是不可分的,是一体的。现在的无人驾驶的记忆就不行。高精度地图那不是记忆。

12430
来自专栏机器之心

专栏 | 深思考:实现人机多轮交互突破是攻克图灵测试的核心

机器之心专栏 作者:杨志明、王泳、毛金涛 本文作者是中科院 NLP 博士,深思考人工智能机器人科技 ideepwise 的首席架构师/CEO 杨志明博士,首席...

446100
来自专栏ATYUN订阅号

【业界】AI发展得有多快? 斯坦福大学给出了一份成绩单

事实证明,我们很难预测AI的新进展何时会发生。在1956年的the Dartmouth Summer Research Project研究项目中,科学家们认为也...

364100
来自专栏AI科技大本营的专栏

专访Uber焦加麟:即便有AI帮助,高精度地图制作仍然少不了人力

作者 | DavidZh 上周在 O'Reilly 和 Intel 人工智能2018北京大会上,Uber 公司资深软件工程师焦加麟做了关于人工智能在高精度地图制...

431110
来自专栏CDA数据分析师

斯坦福重磅发布 丨AI 指数年度报告丨附报告下载

? 斯坦福大学近日重磅发布了 AI 指数 2017 年度报告,从学术、产业、技术等多个角度盘点了 AI 领域的动态和进度。 毋庸置疑 ,AI 是近年来的行业...

21390
来自专栏量子位

2018深度学习十大趋势:元学习成新SGD,多数硬件创企将失败

原作 Carlos E. Perez 李杉 编译自 Intuition Machine博客 量子位 出品 | 公众号 QbitAI ? 2018年,一切可能都会...

33250
来自专栏机器之心

观点 | SwiftKey联合创始人谈智能的基础:创造智能机器也许还需要身体

选自aeon 作者:Ben Medlock 机器之心编译 参与:黄小天、吴攀 本文作者 Ben Medlock 是 SwiftKey 的联合创始人。SwiftK...

358120

扫码关注云+社区

领取腾讯云代金券