学界 | Ian Goodfellow强力推荐:DeepMind提出Auto-encoding GAN的变分方法

AI 科技评论按: 在机器学习研究领域,生成式对抗网络(GAN)在学习生成模型方面占据着统治性的地位,在使用图像数据进行训练的时候,GAN能够生成视觉上以假乱真的图像样本。但是这种灵活的算法也伴随着优化的不稳定性,导致模式崩溃(mode collapse)。将自动编码器(auto-encoder)与GAN相结合,能够使模型更好的表示所有被训练的数据,以阻止模式崩溃。来自Google DeepMind的研究者Mihaela Rosca等人利用生成模型的层级结构,提出了将自动编码器与生成对抗网络相结合的原则,结合了两种方法的优点,得到了顶尖结果。

而Ian Goodfellow也鼎力推荐了论文内容。

以下为 AI科技评论据论文内容进行的部分编译:

论文摘要

生成对抗网络是目前机器学习研究领域学习生成模型的最主要的方法之一,它提供了一种学习隐变量模型的更灵活的算法。定向隐变量模型描述了源噪声数据是如何通过非线性函数变换为貌似真实的数据样本的,而GAN则通过辨别真实数据和模型生成数据来驱动学习过程。GAN可以在大型数据集上进行训练,当使用图像数据进行训练的时候,GAN能够生成视觉上相当真实的图像样本。但这种灵活性也带来了优化过程中的不稳定性,会导致模式崩溃的问题,即生成的数据不能反应潜在的数据分布的差异。基于自编码器的GAN(auto-encoder-based GAN, AE-GAN)正是为了解决这个问题的GAN变种,它使用了自动编码器来鼓励模型更好的表示所有被训练的数据,从而阻止模式崩溃。

自动编码器的应用成功的改善了GAN训练。例如,即插即用生成网络(plug and play generative network, PPGN)通过优化结合了自动编码器损失,GAN损失,和通过与训练的分类器定于的分类损失的目标函数,得到了最高水平的样本。AE-GAN可以大致分为三种:(1)使用自动编码器作为判别器,例如energy-based GAN和boundary-equilibrium GAN。(2)使用去噪自动编码器以得到更称其的辅助损失函数,例如denoising feature matching GAN。(3)结合了VAE和GAN的方法,例如变分自动编码器GAN(variational auto-encoder GAN, VAE-GAN)。

该论文中,作者提出了结合AE-GAN的原则性方法。通过探索由GAN学习到的隐变量模型的层次结构,作者展示了如何将变分自动编码器与GAN结合到一起。该方法能够克服各自方法的限制,因此具有极大的优势。当基于图像进行训练时,VAE方法经常会生成模糊的图像,但VAE不会像GAN一样受到模式崩溃问题的困扰。GAN几乎不允许对模型进行分布假设,而VAE允许对隐变量进行推断,这对于表征学习,可视化和解释是很有用的。该论文开发的方法结合了这两个方法中的优点,提供统一的学习目标函数,无监督,不需要预训练或外部分类器,并且可以轻松的扩展到其他生成模型任务。

该论文主要进行了一下工作:

  • 表明变分推理(variational inference)同样使用与GAN,以及如何可以将判别器用于具有隐式后验近似的变分推理。
  • 在学习生成模型时,可以组合likelihood-based和likelihood-free模型。在likelihood-free设定中,开发了具有合成似然性的变分推理,使得可以学习这种模型。
  • 制定了自动编码GAN(auto-encoding GAN,α-GAN)的原则目标函数,并描述了使它进行实际工作所需的思考。
  • 评估是GAN研究中的主要挑战之一,作者使用了一系列评估措施仔细评估了该方法的性能,与DC-GAN, WGAN和对抗-生成-编码器(adversarial-generator-encoder,AGE)进行比较,展示了论文中的方法与这些方法有相媲美的性能,并强调隐生成模型中持续评估的挑战。

实验结果

为了更好地理解基于自动编码器的方法在GAN领域中的重要性,作者将该方法与其他GAN方法在三个数据集上进行了对比,包括混合模型AGE,和其他纯GAN方法的变种,例如DCGAN和WGAN-GP。数据集为ColorMNIST,CelebA和CIFAR-10。在实验中,使用了Inception score,MS-SSIM和Independent Wasserstein critic作为评估指标。为了综合分析实验结果,结果采用了每个算法获得的最佳值。为了评估模型对超参数的敏感性,采用了每个模型各个超参数中最好的十个,在图中由黑色圆圈表示。

图一:Wasserstein critic指标下各方法的实验结果

图二:Sample diversity和Inception score指标下各方法实验结果

ColorMNIST数据集结果:

在上图(a)中比较了Wasserstein critic指标的值,其中值越高越好。该方法对超参数的敏感度较低,在这个指标下,该方法在各种设置下都取得了最佳的性能。这也在下图生成的样本中得到了证明:

从左到右分别为:DCGAN,WGAN-GP,AGE,论文中方法

CelebA数据集结果:

CelebA数据集有64*64像素的名人脸图片组成。下图展示了四种模型生成的样本。作者也在Wasserstein critic指标下(见图一(b))和sample diversity score标准下(见图二(a))对各方法进行了比较,论文中方法与WGAN-GP和AGE方法有接近的表现。

从左到右分别为:DCGAN,WGAN-GP,AGE,论文中方法

CIFAR-10数据集结果:

下图中展示了CIFAR-10数据集上四种模型生成的样本。如图一(c)所示,在Wasserstein critc指标下,WGAN-GP是最佳模型。如图二(b)所示,基于ImageNet的Inception score中,论文种方法有最佳的性能,如图二(c)所示,基于CIFAR-10的Inception score中,论文中方法与DC-GAN有相近的性能。

从左到右分别为:DCGAN,WGAN-GP,AGE,论文采用的方法

想要深入了解该方法的请阅读原论文:https://arxiv.org/pdf/1706.04987.pdf

原文发布于微信公众号 - AI科技评论(aitechtalk)

原文发表时间:2017-07-01

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏专知

【论文笔记】对话模型新方法,条件DialogWAE生成多模态回答

DialogWAE: Multimodal Response Generation with Conditional Wasserstein Auto-Enco...

2022
来自专栏SIGAI学习与实践平台

生成式对抗网络模型综述

原创声明:本文为 SIGAI 原创文章,仅供个人学习使用,未经允许,不得转载,不能用于商业目的。

1955
来自专栏机器学习算法与Python学习

推荐|深度学习领域引用最多的20篇论文,建议收藏!

深度学习是机器学习和统计学交叉领域的一个子集,在过去的几年里得到快速的发展。强大的开源工具以及大数据爆发使其取得令人惊讶的突破进展。本文根据微软学术(acade...

1225
来自专栏大数据文摘

斯坦福CS224d深度学习课程第八弹: RNN,MV-RNN与RNTN

1052
来自专栏机器之心

ICLR 2018 | 谷歌大脑Wasserstein自编码器:新一代生成模型算法

39410
来自专栏IT派

深度学习基础+网络模型

文中的链接请点击网址:http://yerevann.com/a-guide-to-deep-learning/ 预备知识 ? 你必须有大学数学知识。你可以在深...

3778
来自专栏SIGAI学习与实践平台

生成式对抗网络模型综述

原创声明:本文为 SIGAI 原创文章,仅供个人学习使用,未经允许,不得转载,不能用于商业目的。

2704
来自专栏智能计算时代

统计学基础知识

1.统计学基本概念 统计学:收集、处理、分析、解释数据并从中得出结论的科学。 数据分析的方法可分为描述统计和推断统计。 ? ? ...

2865
来自专栏fangyangcoder

GAN笔记——理论与实现

GAN这一概念是由Ian Goodfellow于2014年提出,并迅速成为了非常火热的研究话题,GAN的变种更是有上千种,深度学习先驱之一的Yann LeCun...

2152
来自专栏量子位

17种GAN变体的Keras实现请收好 | GitHub热门开源代码

? △ 来源:Kaggle blog 从2014年诞生至今,生成对抗网络(GAN)始终广受关注,已经出现了200多种有名有姓的变体。 这项“造假神技”的创作范...

5456

扫码关注云+社区