学界 | Ian Goodfellow详解GANs诞生始末:没有重现,谈何理解?

AI科技评论按:Ian Goodfellow 作为当代人工智能最为瞩目的研究者之一,不论是作为 Yoshua Bengio 的得意门生,还是在 OpenAI 及谷歌间跳槽辗转,他的一举一动都饱受关注。但奠定他人工智能地位的重要一着,当属 Goodfellow 提出的生成式对抗网络(GANs)了,在 2016 年年底,他也在 NIPS 大会上分享了研究成果。日前,Wired 对 IanGoodfellow 进行了采访,了解了 GANs 的研究起源,由AI科技评论进行编译。

1988 年 2 月 15 日,也就是1965 年诺贝尔物理奖得主理查德·费曼因腹膜癌逝世的那一天,他教室的黑板留下了这样一句话:「我不能理解我无法创造之物。」这句名言被谷歌大脑团队的 Ian Goodfellow 用来解释人工智能的设计逻辑:「人工智能无法理解它不能创造的东西。」

「生成模型」是 Goodfellow 在谷歌建立的一个新的研究小组,系统能够创建图像、声音及其它真实世界的表征。Goodfellow 引用了费曼的话,认为这是实现人工智能的必由之路。

时间追溯到 2014 年,当 Goodfellow 还在蒙特利尔大学读博之时,他在一次醉酒的讨论中激发了构建一种名为「generative adversarial networks」,也就是 GANs 的 AI 技术。

现在,对 GANs 有粗略了解的学者都能说出这个观点的核心概念:一个生成器生成图像;一个判别器判断图像的真假。Goodfellow 表示:「你可以把两者理解为艺术家与评论家,前者想骗过评论家的眼睛,让他相信自己所呈现的画是真的。」因此,两者就能够在这个过程中不断提升各自的水平,直到摆脱人类的指导。

Facebook 首席科学家,深度学习三大巨头的 Yann LeCun 认为,「GANs 是近 20 年来深度学习领域诞生的最有意思的想法。」

深度学习作为人工智能的一个分支,改变了以谷歌、微软、亚马逊及 Facebook 为代表的互联网巨头的发展方向。虽然 Goodfellow 的想法还有待完善,但这一想法已经迅速扩展到整个 AI 界。包括 LeCun 在内的很多研究者认为 GANs 是实现无监督学习的可能路径。

而 Goodfellow 又是在怎样偶然的情况下设计出 GANs 的呢?他当时在 Les 3 Brasseurs 酒吧,和很多好友一同饯别博士毕业、如今就职于 DeepMind 的 Razvan Pascanu。其中一人谈到了他正在做的研究,即用统计学的方式将照片数据输入计算机,使之创建图片。当时 Goodfellow 认为这个想法不可能行得通,因为这涉及太多的统计学数据了。但在同时,他想到了一个更好的方法:神经网络能够教机器如何生成真实的图片。

Goodfellow 提出,可以构造两个神经网络,一个能学习生成真实图片,另一个能够判断真伪并给予反馈,通过这样的方式,他认为可以教会神经网络如何生成非常逼真的图片。

当时这个想法遭到了朋友的反驳,他们认为这个方法并不管用。而在聚会结束之后,微醺的 Goodfellow 回到家,「我感觉有点醉,而女朋友已经睡着了。我就在笔记本电脑上彻夜编出了 GANs 模型。实在是非常幸运,如果没有那晚的成功,可能我就放弃了这个想法。」

随后,Goodfellow 根据当晚的想法与几位研究者提出了 GANs 的概念,在第一篇论文里,两个神经网络通过生成式对抗学习,生成了手写数字的图片。而在接下来的三年间,上百篇论文都围绕这一概念进行探索。如今,从猫到火山再到星系,几乎任何事物都能当作生成图片的对象,甚至,它还协助了天文实验及物理学的研究。

尽管想法美好,现实却推进困难。毕竟要训练的神经网络不是一个,而是两个。Goodfellow 在谷歌建立的 GANs 研究团队目前所做的,就是尽可能地精简研究过程。「作为一名机器学习研究者,我需要研究可靠的训练方式。」

而除了生成图片与声音,系统还能够识别音画。能在少量人为干预的情况下,系统就能学到更多的知识。「模型能够理解世界如何构成,」Goodfellow 表示,「而且能在不进行明确告知的情况下进行学习。」

GANs 甚至能实现无监督的学习,实际上这一理念还没有化为现实。目前,神经网络能通过分析百万张猫的照片而成功识别,但需要人类大量进行人为标记,而且涉及人类的深度参与。人类的介入也一直成为 AI 研究者所考虑的问题。以 LeCun 为代表的研究者正在努力推进无监督学习系统,毫无疑问,这将推进人工智能的发展。

但这只是开始。GANs 将带来更多的可能性。南加利福尼亚大学的 AI 研究员 David Kale 认为,因为 GANs 能生成伪造数据,因此它能够在不侵犯用户隐私的前提下构建医疗 AI。机器学习得以在这些新生成的数据上进行训练。Kale 表示,「比起将患者数据放到互联网上(承受可能带来的隐私风险),为何我们不能训练 GANs 生成一个数据集,再用于其它领域的研究呢?」

有许多研究者在探究 GANs 背后的奥秘,而 Goodfellow 则打算在谷歌建立一个专门的团队。在离开谷歌加入 OpenAI 一年之后,他又重回谷歌,为了更好地与合作者们沟通。「花费一整天视频通话并不好玩,也不是解决工作的最佳途径。」

分享诚然重要,但密切的合作亦是如此——不论是 AI 研究者还是神经网络,都是一样。

Via Wired

原文发布于微信公众号 - AI科技评论(aitechtalk)

原文发表时间:2017-04-12

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏新智元

【专访】MSRA周明团队,NLP铁军“超越人类”技术揭秘

作者:弗朗西斯 【新智元导读】2018年1月3日,微软亚洲研究院的r-net率先在SQuAD EM值达到82.650,这意味着在ExactMatch (精准匹配...

3195
来自专栏AI科技评论

李飞飞:在物体识别之后,计算机视觉还要多久才能理解这个世界?

AI科技评论按:9 月 26 日,机器人领域的顶级学术会议 IROS 2017 进入第二日。上午,著名华人计算机视觉专家、斯坦福副教授李飞飞,在温哥华会议中心面...

2706
来自专栏AI科技大本营的专栏

围棋天团告负!1v5英雄“狗”背后的原理概括

今天,中国围棋峰会进行到了第四天,AlphaGo挑战两种未曾体验过的比赛:人机配对赛和1v5的团体赛。 对于全新的比赛形式,棋圣聂卫平与AlphaGo之父哈萨比...

35511
来自专栏人工智能头条

讲真?一天就学会了自动驾驶——强化学习在自动驾驶的应用

1002
来自专栏机器之心

机器学习近年来之怪现状

总体来说,机器学习(ML)的研究人员正在致力于数据驱动算法知识的创建与传播。在一篇论文中提到,研究人员迫切地想实现下列目标的任一个:理论性阐述可学习内容、深入理...

862
来自专栏专知

【中国计算机大会2017】丘成桐,沈向洋,李飞飞精彩演讲内容荟萃

丘成桐演讲全文:工程上取得很大发展,但理论基础仍非常薄弱,人工智能需要一个可被证明的理论作为基础 今天很荣幸地收到你们的邀请来做一个演讲。我本人在数学上的贡献不...

3457
来自专栏AI科技大本营的专栏

传统程序员要不要转行到AI?

近年来,随着 Google 的 AlphaGo 打败韩国围棋棋手李世乭之后,机器学习尤其是深度学习的热潮席卷了整个 IT 界。所有的互联网公司,尤其是 Goog...

661
来自专栏机器之心

观点 | 深度学习虽好,但也有深度的烦恼

选自SIAM 作者:Michael Elad 机器之心编译 参与:微胖、李泽南 本文作者 Michael Elad 是以色列理工学院的计算机科学教授,他也是学术...

2756
来自专栏大数据文摘

深度丨掌握地球?智能机器带来的真正风险

1404
来自专栏腾讯技术工程官方号的专栏

腾讯AI Lab副主任俞栋在GMIS 2017大会上的演讲:语音识别领域的四项前沿研究

本文转载自机器之心 作者:黄小天 5 月 27 日,由机器之心主办、为期两天的全球机器智能峰会(GMIS 2017)在北京 898 创新空间顺利开幕。大会第一天...

1915

扫码关注云+社区