前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >NVIDIA 论文:用 GAN 生成高清图像 | ICLR 2018

NVIDIA 论文:用 GAN 生成高清图像 | ICLR 2018

作者头像
AI研习社
发布2018-03-19 10:20:01
1.4K0
发布2018-03-19 10:20:01
举报
文章被收录于专栏:AI研习社

虽然 ICLR 2018 将公开评审改成了评审人和作者相互不知道双方信息的双盲评审,但论文的投稿者仍然可以通过其他公开渠道对其论文进行推广。尤其对于大公司研究院来说,早早公开自己的论文能比盲审有额外加成。

例如 AI 研习社就注意到,就在上周五 ICLR 论文投递截止后不久,NVIDIA 在 Blog 上就发布了一篇通过生成对抗网络(GAN)产生独特面孔的新方法,这篇论文正是 NVIDIA 投递到 ICLR 的论文之一。

论文题目:Progressive Growing of GANs for Improved Quality, Stability, and Variation

摘要:在本文中,我们描述了生成对抗网络(GAN)的新的训练方法。 关键思想是通过渐进的方式训练生成器和鉴别器:从低分辨率开始,我们逐步添加新的层次,从而在训练进展中增加更精细的细节。 这既加快了训练速度,又能增加训练的稳定性,从而使我们能够制作出前所未有的质量的图像,例如用 1024x1024 像素的 CelebA 图像(AI研习社注:CelebA 是中国香港中文大学发布的 20 多万的名人人脸数据库,被很多算法用来训练)制作更高精度的数据集。 我们还提出了一种增加生成图像变化的简单方法,并且在无监督的 CIFAR10 中实现了创记录的 8.80 的初始分数。 此外,我们描述了几个实现细节,这些细节对于抑制生成器和鉴别器之间的不健康竞争非常重要。 最后,我们提出了一个新的衡量 GAN 结果的指标,无论是在图像质量和变化方面。 作为额外的贡献,我们构建了更高质量的 CelebA 数据集。

在论文中 NVIDIA 称,在从高维数据分布生成新样本的方法在图像领域中被广泛使用,主流算法包括自回归模型(Autoregressive Models)、变化自动编码器(VAE)和生成对抗网络(GAN)。这几种算法都有着各自的优势和劣势:自回归模型(如 PixelCNN)能产生清晰的图像,但评估速度较慢,而且由于其直接对像素的条件分布直接建模,因此没有潜在的表征,这也进一步限制了其适用性;VAE 易于训练,但生成的结果往往是模糊的;GAN 可以生成清晰的图像,但在分辨率上只能有小范围的变化,而且质量一直不稳定;混合方法可以结合上述三种方法的优势,但在图像质量上仍落后于 GAN。

NVIDIA 的主要改进方法是使用改进的 Wasserstein Loss同时也尝试最小二乘法损失。由于生成高分辨率图像之所以困难是因为这一过程中会极大放大梯度问题,而且由于内存的限制,大图片还要分割成若干块分别计算,从而影响了训练的稳定性。而 NVIDIA 的做法是从简单的低分辨率图像开始,在训练时逐步添加更高分辨率细节的层次,从而大大加快了训练和提高高分辨率的稳定性。

让我们来看一下图片生成的效果。

下图是训练开始 2 个多小时候,8X8 的效果。

经过 11 个多小时训练后,生成图片分辨率提升为 32x32,已经能看出面孔的轮廓了;

训练 16 天后的 1024x1024 分辨率图片:

NVIDIA 还专门准备了一部关于这篇论文的说明短片,更加直观说明了这一算法的具体效果:

据 AI 研习社了解,这一方法也可以用来生成非常精细的物体和风景照片、以及图像软件中的变化效果等。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2017-11-01,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AI研习社 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档