前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >《白话深度学习与Tensorflow》学习笔记(7)RBM限制玻尔兹曼机

《白话深度学习与Tensorflow》学习笔记(7)RBM限制玻尔兹曼机

作者头像
微风、掠过
发布2018-04-10 11:49:10
1K0
发布2018-04-10 11:49:10
举报

不受限的:在实际工程中用处不大,所以目前只需要研究受限玻尔兹曼机。

一层是可视化层,一般来说是输入层,另一层是隐含层,也就是我们一般指的特征提取层。

RBM是可以多层叠加在一起的。

上面的h1到hn是n个实数,下面的v1到vm是m个实数,都是0到1之间的数字,它们各自组成了一个h向量和一个v向量。

逻辑回归:其实这是一个伯努利分布(二项分布)的演化,正例概率是p,负例为1-p。

令s=P/1-p  t=ln(s).

f(x)就是1产生的概率p,x就是这个多维向量。

逻辑回归的损失函数:

最大似然度:有一个未知参数向量,这是一种条件描述。观测对象数据用x来表示,在观测过程中x会有一定的概率分布。

未知向量

如果你观测到一个正态分布,那么P(x)就表示为

最大似然:一个连乘关系的最大值可以根据取对数后找到极大值的点。

对于完整的X=wTx,x1到xn叫做“解释变量”,而u叫做随机扰动项,是在随机过程中的一种不确定的值,且这个u也是服从正太分布的。

3sigma准则。

损失函数:

RBM的损失函数是CD(contrasive divergence对比散度)学习目标是最大似然度 让网络学习到一个矩阵,使得网络中拟合的概率“全局性”最大。

RBM的能量模型:

就是参数w,c,b后面的能量表示:一个是权重w连接两侧节点的v和h产生的,必须三个都为1才算有能量的输出;另外两个则是节点上的偏置和节点输入的向量维度值相乘,也必须都为1才算有能量的输出。

通过最大化这个P(v)(取其对数的值)对于对比散度,只利用这两个式子,然后让向量在这个网络的两侧不断反弹,吃书画网络权重w,用一个向量v通过网络映射来得到h,然后是第一次反弹,用h通过网络反过来生成v’;然后是第二次反弹,用这个v’通过网络生成h’。然后根据L函数的导数来更新w。

能量模型的意义:

[if !supportLists]第一、[endif]RBM网络是一种无监督学习的方法,无监督学习的目的是最大可能的拟合输入数据,所以学习RBM网络的目的是让RBM网络最大可能地拟合输入数据。

[if !supportLists]第二、[endif]能量模型能为无监督学习方法提供两个东西:a)目标函数;b)目标解。

[if !supportLists]第三、[endif]任何概率分布都可以转变成基于能量的模型,而且很多的分布都可以利用能量模型的特有的性质和学习过程,有些甚至从能量模型中找到了通用的学习方法。

能量模型需要两个东西,一个是能量函数,另一个是概率,有了概率才能跟要求解的问题联合起来。

深度学习中可以由多个RBM叠加而成。

应用:分类问题,降维可进行串并联的使用,也就是通过多个RBM模型来形成一个完整的工作网络。

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2017.11.19 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档