学界 | Ian Goodfellow强力推荐:DeepMind提出Auto-encoding GAN的变分方法

AI 科技评论按: 在机器学习研究领域,生成式对抗网络(GAN)在学习生成模型方面占据着统治性的地位,在使用图像数据进行训练的时候,GAN能够生成视觉上以假乱真的图像样本。但是这种灵活的算法也伴随着优化的不稳定性,导致模式崩溃(mode collapse)。将自动编码器(auto-encoder)与GAN相结合,能够使模型更好的表示所有被训练的数据,以阻止模式崩溃。来自Google DeepMind的研究者Mihaela Rosca等人利用生成模型的层级结构,提出了将自动编码器与生成对抗网络相结合的原则,结合了两种方法的优点,得到了顶尖结果。

而Ian Goodfellow也鼎力推荐了论文内容。

以下为 AI科技评论据论文内容进行的部分编译:

论文摘要

生成对抗网络是目前机器学习研究领域学习生成模型的最主要的方法之一,它提供了一种学习隐变量模型的更灵活的算法。定向隐变量模型描述了源噪声数据是如何通过非线性函数变换为貌似真实的数据样本的,而GAN则通过辨别真实数据和模型生成数据来驱动学习过程。GAN可以在大型数据集上进行训练,当使用图像数据进行训练的时候,GAN能够生成视觉上相当真实的图像样本。但这种灵活性也带来了优化过程中的不稳定性,会导致模式崩溃的问题,即生成的数据不能反应潜在的数据分布的差异。基于自编码器的GAN(auto-encoder-based GAN, AE-GAN)正是为了解决这个问题的GAN变种,它使用了自动编码器来鼓励模型更好的表示所有被训练的数据,从而阻止模式崩溃。

自动编码器的应用成功的改善了GAN训练。例如,即插即用生成网络(plug and play generative network, PPGN)通过优化结合了自动编码器损失,GAN损失,和通过与训练的分类器定于的分类损失的目标函数,得到了最高水平的样本。AE-GAN可以大致分为三种:(1)使用自动编码器作为判别器,例如energy-based GAN和boundary-equilibrium GAN。(2)使用去噪自动编码器以得到更称其的辅助损失函数,例如denoising feature matching GAN。(3)结合了VAE和GAN的方法,例如变分自动编码器GAN(variational auto-encoder GAN, VAE-GAN)。

该论文中,作者提出了结合AE-GAN的原则性方法。通过探索由GAN学习到的隐变量模型的层次结构,作者展示了如何将变分自动编码器与GAN结合到一起。该方法能够克服各自方法的限制,因此具有极大的优势。当基于图像进行训练时,VAE方法经常会生成模糊的图像,但VAE不会像GAN一样受到模式崩溃问题的困扰。GAN几乎不允许对模型进行分布假设,而VAE允许对隐变量进行推断,这对于表征学习,可视化和解释是很有用的。该论文开发的方法结合了这两个方法中的优点,提供统一的学习目标函数,无监督,不需要预训练或外部分类器,并且可以轻松的扩展到其他生成模型任务。

该论文主要进行了一下工作:

  • 表明变分推理(variational inference)同样使用与GAN,以及如何可以将判别器用于具有隐式后验近似的变分推理。
  • 在学习生成模型时,可以组合likelihood-based和likelihood-free模型。在likelihood-free设定中,开发了具有合成似然性的变分推理,使得可以学习这种模型。
  • 制定了自动编码GAN(auto-encoding GAN,α-GAN)的原则目标函数,并描述了使它进行实际工作所需的思考。
  • 评估是GAN研究中的主要挑战之一,作者使用了一系列评估措施仔细评估了该方法的性能,与DC-GAN, WGAN和对抗-生成-编码器(adversarial-generator-encoder,AGE)进行比较,展示了论文中的方法与这些方法有相媲美的性能,并强调隐生成模型中持续评估的挑战。

实验结果

为了更好地理解基于自动编码器的方法在GAN领域中的重要性,作者将该方法与其他GAN方法在三个数据集上进行了对比,包括混合模型AGE,和其他纯GAN方法的变种,例如DCGAN和WGAN-GP。数据集为ColorMNIST,CelebA和CIFAR-10。在实验中,使用了Inception score,MS-SSIM和Independent Wasserstein critic作为评估指标。为了综合分析实验结果,结果采用了每个算法获得的最佳值。为了评估模型对超参数的敏感性,采用了每个模型各个超参数中最好的十个,在图中由黑色圆圈表示。

图一:Wasserstein critic指标下各方法的实验结果

图二:Sample diversity和Inception score指标下各方法实验结果

ColorMNIST数据集结果:

在上图(a)中比较了Wasserstein critic指标的值,其中值越高越好。该方法对超参数的敏感度较低,在这个指标下,该方法在各种设置下都取得了最佳的性能。这也在下图生成的样本中得到了证明:

从左到右分别为:DCGAN,WGAN-GP,AGE,论文中方法

CelebA数据集结果:

CelebA数据集有64*64像素的名人脸图片组成。下图展示了四种模型生成的样本。作者也在Wasserstein critic指标下(见图一(b))和sample diversity score标准下(见图二(a))对各方法进行了比较,论文中方法与WGAN-GP和AGE方法有接近的表现。

从左到右分别为:DCGAN,WGAN-GP,AGE,论文中方法

CIFAR-10数据集结果:

下图中展示了CIFAR-10数据集上四种模型生成的样本。如图一(c)所示,在Wasserstein critc指标下,WGAN-GP是最佳模型。如图二(b)所示,基于ImageNet的Inception score中,论文种方法有最佳的性能,如图二(c)所示,基于CIFAR-10的Inception score中,论文中方法与DC-GAN有相近的性能。

从左到右分别为:DCGAN,WGAN-GP,AGE,论文采用的方法

想要深入了解该方法的请阅读原论文:https://arxiv.org/pdf/1706.04987.pdf

原文发布于微信公众号 - AI科技评论(aitechtalk)

原文发表时间:2017-07-01

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏新智元

【谷歌大脑团队GAN生态权威报告】6种优化GAN模型对比,最优秀的仍是原始版本

来源:arXiv 编译:刘小芹 【新智元导读】谷歌大脑团队的研究者发表题为《Are GANs Created Equal? A Large-Scale Stud...

33910
来自专栏AI研习社

OpenAI“巧妙”发现无监督情感神经元,可利用文本检测用户情感

日前,OpenAI在官网公布了一项新研究成果,介绍了一个可以高效学习情感表征的无监督系统,它能够预测亚马逊评论中的下一个字符。 研究人员采用了线性模型,在一个小...

3539
来自专栏AI科技评论

深度神经网络发展历程全回顾:如何加速DNN运算?

深度神经网络(DNN)目前是许多现代AI应用的基础。自从DNN在语音识别和图像识别任务中展现出突破性的成果,使用DNN的应用数量呈爆炸式增加。这些DNN方法被大...

3066
来自专栏机器之心

ECCV 2018 | 旷视科技提出GridFace:通过学习局部单应变换实现人脸校正

论文名称:《GridFace: Face Rectification via Learning Local Homography Transformations...

543
来自专栏新智元

复旦、清华和英特尔中国研究院ICCV新作:完全脱离预训练模型的目标检测方法

【新智元导读】复旦大学、清华大学和英特尔中国研究院合作提出的一种新型的目标检测方法 (DSOD) ,能够在完全脱离预训练模型的情况下,使用有限训练数据,达到st...

2493
来自专栏新智元

CVPR 2018:阿里提出应用 LocalizedGAN 进行半监督训练

1605
来自专栏新智元

【Ian Goodfellow盛赞】一个GAN生成ImageNet全部1000类物体

【新智元导读】Ian Goodfellow刚刚在Twitter盛赞一篇论文,担心仅仅浏览摘要无法充分体会其突破。这篇正在ICLR-18双盲审核中的论文,提出了一...

36111
来自专栏UAI人工智能

OpenAI 首个研究成果 生成式模型系列

1294
来自专栏机器之心

学界 | 提升DNN参数准确度:MILA提出贝叶斯超网络

选自arXiv 机器之心编译 参与:蒋思源、李泽南 深度神经网络(DNN)参数中简单而强大的贝叶斯推理(Bayesian inference)技术有可能大大扩展...

2718
来自专栏AI科技大本营的专栏

首发 | 何恺明团队提出 Focal Loss,目标检测精度高达39.1AP,打破现有记录

翻译|AI科技大本营(rgznai100) 参与 | 周翔,尚岩奇 他可谓神童。 2009年,在 IEEE 举办的 CVPR 大会上,还在微软亚研院(MSRA)...

2566

扫描关注云+社区