论文Express | 谷歌DeepMind最新动作:使用强化对抗学习,理解绘画笔触

大数据文摘作品

作者:龙牧雪

深度学习合成图像并不是什么新鲜事。谷歌自己就做过SketchRNN,能识别8条腿的猪有异常,输出4条腿的猪(戳这里看)。

不过这些都依赖于人类输入数据的指导。人类需要告诉模型,哪些输入图片是猪,模型才能从中总结规律。

昨天,谷歌DeepMind发出了一篇博文,介绍了其最新论文Synthesizing Programs for Images using Reinforced Adversarial Learning(大数据文摘公众号后台回复“图像”即可下载)。

谷歌使用一种名叫SPIRAL的对抗性学习方法,先用一个强化学习代理(Agent)随机画画,再将成果输入另一个神经网络鉴别器(Discriminator)。鉴别器能判断某图形是由Agent生成的,还是从真实照片的数据集中采样而来。

如果代理生成的图像成功地骗过了鉴别器,就会获得奖励。也就是说,奖励函数本身也是由代理学习得来,人类并没有设置奖励函数。这样经过持续训练,强化学习得到的图像就会越来越接近真实照片。

该方法与生成对抗网络(GANs)的区别是,GANs中的生成器通常是直接输出像素值的神经网络。但是强化学习代理通过编写图形程序与绘图环境交互来生成图像,也就是说,可以将生成的图像中绘画的笔触通过一个机械臂画笔实现出来。

根据谷歌放出的一个绘画视频,该方法在数字、人物肖像的生成上,均取得了不错的效果。

谷歌绘画的视频

视频内容

在MNIST手写数字图像生成的实验中,输入数据包括手写数字的图像,但没有明确指出它们是如何绘制的。强化学习代理需要通过自学数字书写的笔画(图案、笔触强弱、笔顺),控制画笔,重现特定的图像。接下来,鉴别器将作出预测,该图像是目标图像的副本,还是由代理生成的。图像越难鉴别,代理得到的回报越多。

重要的是,这一切是可以解释的,因为它产生了一系列控制模拟画笔的动作。同时值得注意的是,这里对绘画的笔顺并没有强调,只要画得像,就不管是怎么画出来的了。

在人脸的真实数据集上,强化对抗式学习也取得了不错的效果。绘制人脸时,代理能够捕捉到脸部的主要特征,例如脸型、肤色和发型,就像街头艺术家用寥寥几笔描绘肖像时一样:

谷歌称,教会人工智能从对世界的观察中获得结构关系并表达出来,这是人工智能建立人类认知、概括和沟通能力的必由之路。

谷歌DeepMind博文链接:

https://deepmind.com/blog/learning-to-generate-images/

原文发布于微信公众号 - 大数据文摘(BigDataDigest)

原文发表时间:2018-03-29

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏专知

【攻克Dota2基础算法】深度Q学习介绍

【导读】最近,OpenAI在dota2的5v5比赛中,使用基于强化学习的AI bot击败了人类玩家,震惊业界。那么强化学习是如何操纵游戏人物一步步达成胜利的呢?...

1817
来自专栏算法channel

深度学习|大师之作,必是精品

1neural networks and deep learning 这是一个非常经典的神经网络和深度学习的教程,有完整的免费的电子书,网址如下: http:/...

3937
来自专栏人工智能头条

Top 50机器学习项目实战总结

4272
来自专栏人人都是极客

自动驾驶中的时空坐标系

下面我们介绍自动驾驶技术中几种常用的坐标系统,以及他们之间如何完成关联和转换,最终构建出统一的环境模型。 所谓时空坐标系,包括三维空间坐标系和一维时间坐标系。在...

9927
来自专栏PPV课数据科学社区

如何「科学的比较」机器学习模型表现?

最近在赶paper,码字的时间不多,也刚好借着这个机会践行“写少、少写,写好”。今天谈谈如何对比多个机器学习算法的性能,阅读本文需要基本的统计检验知识,比如明白...

47210
来自专栏机器学习之旅

Kaggle&TianChi分类问题相关算法快速实现导读理论解析如何设计一个Stacking|Ensemble的模型?案例复现

17/12/30-update :很多朋友私密我想要代码,甚至利用金钱诱惑我,好吧,我沦陷了。因为原始代码涉及到公司的特征工程及一些利益trick,所以我构造了...

2212
来自专栏ATYUN订阅号

AI设计小能手:选个颜色让AI帮你生成logo

生成对抗网络(GAN)已被用于发现新药物,创建令人信服的汉堡和蝴蝶照片,并产生脑癌的合成扫描。而荷兰马斯特里赫特大学(Maastricht University...

2106
来自专栏积累沉淀

数据挖掘算法之深入朴素贝叶斯分类

写在前面的话:   我现在大四,毕业设计是做一个基于大数据的用户画像研究分析。所以开始学习数据挖掘的相关技术。这是我学习的一个新技术领域,学习难度比我以往学过的...

3558
来自专栏AI科技评论

视频 | 2分钟论文:神经网络这么弱?改一个像素就懵圈了

AI 科技评论按:这里是,雷锋字幕组编译的 Two minutes paper 专栏,每周带大家用碎片时间阅览前沿技术,了解 AI 领域的最新研究成果。

1306
来自专栏机器之心

业界 | 谷歌开源高效的移动端视觉识别模型:MobileNet

选自Google Research 机器之心编译 参与:蒋思源 近日,谷歌开源了 MobileNet,它一个支持多种视觉识别任务的轻量级模型,还能高效地在移动...

3366

扫码关注云+社区

领取腾讯云代金券