“印钞机”与“验钞机”

人工智能领域有个热词“对抗生成网络”,其实它就是大名鼎鼎的GAN网络。这个网络有意思的地方在于,它是教你“印假钞”的,我们可以把它想象成“验钞机”和“印钞机”的对抗。

这个模型是由两部分组成的,分别是判别器和生成器。生成器的任务是使用原料去生成一种无限逼近“真钱”的“假钱”,判别器的任务是从“真钱”中区分出“假钱”。这个模型之所以叫对抗生成网络,是因为,判别器和生成器在不断地对抗、进化。一开始生成器造出来的“钱”,很粗糙,判别器毫不费劲地判断它是“假钱”。慢慢地,生成器在不断地进步,判别器想要找出“假钱”变得困难了。直到最后,也就是最理想的情况,生成器可以造出足够逼真的“假钱”,而判别器无法看出这种“假钱”和“真钱”的区别。

生成器的原理虽然非常简单,但是它可以生成一些有意义的数据。比如,我们想要一批梵高风格的画,怎么办呢?这里可以用上对抗生成网络的原理。首先,用梵高的所有画作,来训练一个生成器,也就是让生成器模仿梵高画画,同时用判别器做裁判。一开始生成器画出来的是随机的涂鸦,判别器很明显就看出来模仿的画作质量很低。但是,在梵高的画作风格指引下,生成器慢慢模仿,画作越来越逼真了。直到判别器认为,它画出来的画作风格和梵高已经很接近了。这样,就可以用这个生成器去创作大量梵高风格的画作。当然,还可以用一段空白的声音,去生成一段古典音乐,听起来是不是很有意思?

这个方法在人工智能领域非常有价值。人工智能的学习算法往往需要大量标注的数据,但是标注数据非常耗费人力财力,而且有些领域根本没有大量的数据,或者存在数据不均衡等问题。因此我们可以使用这种方法去产生大量的数据,解决数据的问题。

不过,对抗生成模型也存在一些问题。最大的问题就是难以训练,以及训练过程不稳定。也就是说,想要造出足够逼真的“假币”是很难的。因为两张“真钱”的相似度是接近100%的,而用这种方法印出来的两张“假钱”,相似度能到达95%就算很不错的了。因此,这种方法只适用于对生成模型要求没有那么高的领域。

(本栏长期征集“日知录”三字篆刻,投稿邮箱:rizhilu999@163.com)

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181119A0Z9BC00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码关注腾讯云开发者

领取腾讯云代金券