专栏首页光城(guangcity)生成式对抗网络——Gan(二)

生成式对抗网络——Gan(二)

生成式对抗网络——Gan(二)

今日知图

选中文本(可视模式)

v 可视模式 从光标位置开始按照正常模式选择文本
V 可视行模式 选中光标经过的完整行
ctrl+v 可视块模式 垂直方向选中文本
ggvG 选中所有内容

0.说在前面1.回顾及进阶2.生成器和判别器到底是什么?3.作者的话


0.说在前面

继续上一篇文章,也就是大家所看到的的本篇文章,下面是作者介绍!

川大本科软件工程刘瑞航,LeoLRH,研究方向,遥感图像相关融合,现在的目的就是尽量保研,Never to be the low, fight for the best!

本篇所有归属权为该作者所有!下面一起来看优秀本科生对生成对抗网络的学习!

1.回顾及进阶

上一篇文章中我们提到了gan网络即对抗神经网络的基本思路和一些有趣的思想。

所以在这篇文章中我们理解一下Gan网络的一些模型的理解以至于数学问题。

本篇文章推导和理解纯属笔者自己所做,如有问题欢迎批评,若有引用一定要进行声明

其实笔者认为所有的神经网络的应用其实都是都是判别式模型。为什么这么说呢?

我们简单的说所有模型应用都是给定一个输入,训练产生一个label输出。从直接对一个图片的分类到句子生成(这也是一个分类问题,我们的label是在词空间中,我们会去逐个学习来产生多词label)

而在这里我们学习的Gan就是我们拓展开来,用神经网络来构建一个生成式模型。就是一个生成器和一个判别器

  • 而在一个GAN中,我们构建两个不同的神经网络。 第一个网络是传统的分类网络叫判别器。 我们会用判别器来判断图片是真实的(属于训练集)还是假的(不在训练集中)。
  • 另一个网络,叫做生成器,会把随机噪音作为输入,然后用一个神经网络通过它生成图片。生成器的目标就是为了骗过判别器,让判别器以为生成的图片是真的。

在数学中我们可以把这个想成是一个最小最大博弈(minimax game)(联想一下那个开山公式), 生成器 (GG)反复的想要糊弄判别器,而判别器 (DD)则要努力的正确区分真实还是假的。

2.生成器和判别器到底是什么?

说起来挺高大上的东西剖析其本质,他们仅仅不过是一个概念,他们都属于supervised learning的模型。他们有什么区别呢?

在我们研究模型时在做一个决策的过程中:求的是[f(x)=]P(Y|X)的概率;x是样本,y是label

先说判别模型,其实他就是很傻的“算”就是给了你x,给了你y让你训练(无脑计算)(用神经网络等)然后得到像“x出现,y是什么的效果“。

这里从x到y的过程其实就是通过我们学习的算法(感知积,决策树,LF,Regression等)来实现求出这样的f(x)

总结一下就是给一个x,出y,给一个x,就出y……这个就是判别模型

而生成器就比判别器要求的高一些,不仅仅要求出f(x),我们的目的还要建立确定出x与y的关系。什么关系呢?

我们看下面公式

概率联合分布定理

(概率联合定理)

当我们前面的不好求时,转换成联合概率时会好算一些(通过频率算法可以将这个P求出来)也就是生成模型要做的是将不好求的P和f,转换成两个比较好求的东西(就是建立其中x,y的关系)

这个就是这两个的区别(笔者认为最通俗的理解方式了)。

然后再具体说一说探究一下生成模型

生成模型其实实在对抗生成模型前就已经提出来了。我们这里使用的生成模型只不过是其中最直接的生成模型。(生成模型可是个“大家族”)

生成模型由这两方面组成:包括密度预测(给一大堆散点)和样本生成(给你一些乱七八糟的东西生成一个类似的东西)

生成模型的”玩法“

而这里我们为什么要着重学习生成模型呢?

我想这个应该是goodfellow已经替我回答的很明白了

Ian goodfellow的2018PPT 对抗生成网络陈述

下一节我会列出一个简单的gan网络实现,并且用数学的方式好好剖析一下生成模型那个的数学原理(极大似然估计),通过那个来帮助大家理解gan网络的那个开山的公式

本文分享自微信公众号 - 光城(guangcity)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-11-16

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 「回顾」爱奇艺搜索排序模型迭代之路

    本次分享内容为爱奇艺在做视频搜索时,遇到的真实案例和具体问题;以及面对这些问题的时候,我们的解决方案。这次分享的ppt针对一线的开发人员,希望可以给一线的开发人...

    石晓文
  • 打分排序系统漫谈3 - 贝叶斯更新/平均

    上一节我们聊了聊用Wilson区间估计来处理小样本估计,但从原理上来说这种方法更像是一种Trick,它没有从本质上解决样本量小的时候估计不置信的问题,而是给估计...

    风雨中的小七
  • 如何跟随有三从零进阶中级CV算法工程师

    (1) Python前后端与小程序部署,完成一个深度学习开源框架在小程序的完整部署过程,将其最终展示为线上服务,就是有三AI小程序平台了(最近网站安全证书到期不...

    用户1508658
  • 什么数据可以成为“数据资产”?数据资产化又该如何实现?

    数据资产化已成为企业数据资产管理的最重要的环节,怎样识别数据资产、利用现有的数据资产创造价值,将是企业不得不面临的一个课题。

    探码科技
  • 解读人工智能、大数据和云计算的关系,大佬们赌AI竟都输了?

    导读:人工智能(Artificial Intelligence,AI)、大数据(Big Data)和云计算(Cloud Computing)是当前最受关注的技术...

    王知无
  • 一张图看懂数据分析、机器学习、深度学习、人工智能的关系

    一切技术的出现都是为了解决现实问题,而现实问题分为简单问题和复杂问题。简单问题,需要简单分析,我们使用数据分析。复杂问题,需要复杂分析,我们使用机器学习。

    猴子聊数据分析
  • Tree - XGBoost with parameter description

    In the previous post, we talk about a very popular Boosting algorithm - Gradient...

    风雨中的小七
  • Elasticsearch X-Pack 系列之 Machine Learning 解析

      目前腾讯云 CES(Cloud Elasticsearch)已经和 Elastic 官方达成商务合作,引入了 X-Pack 商业套件,支持更多的商业特性,例...

    huanghua
  • 机器学习在MVPD视频广告中的应用

    本文来自MHV (Mile High Video) 2019的演讲,作者是来自于Charter公司的Srilal Weera。本次演讲主要讲述了机器学习在视频分...

    用户1324186
  • 千人千面营销系统在携程金融支付的实践

    携程金融核心产品为:拿去花、借去花、信用卡、理财。其中拿去花提供携程产品分期支付服务,借去花提供现金借款服务,信用卡提供携程联名卡、理财则给用户提供有竞争力的理...

    用户1292807

扫码关注云+社区

领取腾讯云代金券