优秀的你，正在拼搏没？

公众号guangcity

发布于 2019-09-20 11:37:25

3770

发布于 2019-09-20 11:37:25

文章被收录于专栏：光城(guangcity)光城(guangcity)

生成式对抗网络初期知识——Gan（一）

【今日知图】

括号切换

% 括号匹配及切换

0.说在前面1.生成式对抗网络前奏2.基本思想3.生成模型与判别模型4.生成式对抗网络5.基本原理

0.说在前面

今天迎来了我公众号第一篇投稿方，也就是大家所看到的的本篇文章，下面是作者介绍！

川大本科软件工程刘瑞航，LeoLRH，研究方向，遥感图像相关融合，现在的目的就是尽量保研，Never to be the low, fight for the best!

本篇所有归属权为该作者所有！下面一起来看优秀本科生对生成对抗网络的认识！

1.生成式对抗网络前奏

是近些年来最火的无监督学习方法之一，模型由 Goodfellow 等人在 2014 年首次提出，将博弈论中非零和博弈思想与生成模型结合在一起，巧妙避开了传统生成模型中概率密度估计困难等问题，是生成模型达到良好的效果。

2.基本思想

囚徒困境

1950 年，由就职于兰德公司的梅里尔 · 弗勒德和梅尔文 · 德雷希尔拟定出相关困境的理论，后来由顾问艾伯特 · 塔克以囚徒方式阐述，并命名为 “囚徒困境”。经典的囚徒困境如下：

警方逮捕甲、乙两名嫌疑犯，但没有足够证据指控二人有罪。于是警方分开囚禁嫌疑犯，分别和二人见面，并向双方提供以下相同的选择：

若一人认罪并作证检控对方（相关术语称 “背叛” 对方），而对方保持沉默，此人将即时获释，沉默者将判监 10 年。
若二人都保持沉默（相关术语称互相 “合作”），则二人同样判监半年。
若二人都互相检举（互相 “背叛”），则二人同样判监 5 年。

纳什均衡与帕累托最优

如同博弈论的其他例证（详细了解统计学习），囚徒困境假定每个参与者（即 “囚徒”）都是利己的，即都寻求最大自身利益，而不关心另一参与者的利益。那么囚徒到底应该选择哪一项策略，才能将自己个人的刑期缩至最短？两名囚徒由于隔绝监禁，并不知道对方选择；而即使他们能交谈，还是未必能够尽信对方不会反口。就个人的理性选择而言，检举背叛对方所得刑期，总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择：

若对方沉默、我背叛会让我获释，所以会选择背叛。
若对方背叛指控我，我也要指控对方才能得到较低的刑期，所以也是会选择背叛。
二人面对的情况一样，所以二人的理性思考都会得出相同的结论——选择背叛。

背叛是两种策略之中的支配性策略。因此，这场博弈中唯一可能达到的纳什均衡，就是双方参与者都背叛对方，结果二人同样服刑 5 年。这场博弈的纳什均衡。

而这显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言，如果两个参与者都合作保持沉默，两人都只会被判刑半年，总体利益更高，结果也比两人背叛对方、判刑 5 年的情况较佳。但根据以上假设，二人均为理性的个人，且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛，结果二人判监均比合作为高，总体利益较合作为低。这就是 “困境” 所在。

这个例子有效地证明了：非零和博弈中，帕累托最优和纳什均衡是互相冲突的。

这个例子转换成机器学习而言，就是： 生成模型与判别模型

3.生成模型与判别模型

机器学习的任务就是学习一个模型，应用这个模型，对给定的输入预测相应的输出。这个模型的一般形式为决策函数 Y=f(x)，或者条件概率分布：Y=argmaxP(Y|X)。

机器学习方法又可以分为生成方法和判别方法，所利用的的模型分别称为生成模型（Generative Model）和判别模型（Discriminative Model）。

判别方法由数据直接学习决策函数 f(X)，或者条件概率分布 P(Y|X) 作为预测模型，即判别模型。

生成方法由数据学习联合分布 P(X,Y)，然后求出条件概率分布 P(Y|X) 做预测的模型，即为生成模型，具体公式如下：‍‍P(Y|X)=P(X,Y)/P(X)（朴素贝叶斯公式）

‍‍相比于判别方法，生成模型更关注数据之间的内在联系，需要学习联合分布；而判别模型更关注于给定输入 X，模型应该预测怎么样的输出 Y。由生成模型可以推导出判别模型，反之则不能。

4.生成式对抗网络

什么是对抗生成网络？用 Ian Goodfellow 自己的话来说：

生成对抗网络是一种生成模型（Generative Model），其背后基本思想就是从训练库里获取很多训练样本，从而学习这些训练案例生成的概率分布。而实现的方法，是让两个网络相互竞争，‘玩一个游戏’。其中一个叫做生成器网络（ Generator Network），它不断捕捉训练库里真实图片的概率分布，将输入的随机噪声（Random Noise）转变成新的样本（也就是假数据）。另一个叫做判别器网络（Discriminator Network），它可以同时观察真实和假造的数据，判断这个数据到底是不是真的。”

5.基本原理

生成对抗网络是一个强大的基于博弈论的生成模型学习框架。该模型由 GoodFellow 在 2014 年首次提出，结合了生成模型和对抗学习思想。生成对抗网络的目的是训练一个生成模型 G，给定随机噪声向量 noise，生成符合真实数据分布的样本。 G 训练信号来自于判别器 D(x)。 D(x) 的学习目标目是准确区分输入样本的来源（真实数据或生成数据），而生成器 D 的学习目标是生成尽可能真实的数据，使得判别器 G 认为生成数据是真实的。整个模型使用梯度下降法进行训练，生成器和判别器可以根据特定的任务选择具体的模型，包括但不限于全连接神经网络（FCN）、卷积神经网络（CNN）、回归神经网络（RNN）、长短期记忆模型（LSTM）等。