前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布

RMSprop

作者头像
Steve Wang
发布2019-05-26 15:07:29
7090
发布2019-05-26 15:07:29
举报
文章被收录于专栏:从流域到海域从流域到海域

RMSprop,全称:Root Mean Sqaure prop。

要看懂这篇博文,你需要先看懂:

整理并翻译自吴恩达深度学习系列视频: https://mooc.study.163.com/learn/2001281003?tid=2001391036#/learn/content?type=detail&id=2001702124&cid=2001693085

RMSprop

同使用动量的梯度下降一样,RMSprop的目的也是为了消除垂直方向的抖动,使梯度下降快速收敛。

其计算方法(详见下)使用了将导数看作水平方向上的w和垂直方向上的b。并计算dw和db的平方值,这实际上是平方版本的指数加权平均。然后更新的时候又除去了根号求平均值,因此叫做Root Mean Sqaure prop。除法进行的时候因为dw较小,所以计算出的根号也较小,而db较大,所以计算出的根号也较大,因此更新时b变小了,w变化不大。

RMSprop计算方法

在每一次迭代中,计算mini-batch上的:

Sdw=β2Sdw+(1−β2)dW2S_{dw}=\beta_2S_{dw}+(1-\beta_2)dW^2Sdw​=β2​Sdw​+(1−β2​)dW2<- element-wise

Sdb=β2Sdb+(1−β2)db2S_{db}=\beta_2S_{db}+(1-\beta_2)db^2Sdb​=β2​Sdb​+(1−β2​)db2 <- element-wise

更新方法变成:

W=W−αdWSdw+ϵW = W-\alpha \frac{dW}{\sqrt{S_{dw}+\epsilon}}W=W−αSdw​+ϵ​dW​

b=b−αdbSdb+ϵb = b-\alpha \frac{db}{\sqrt{S_{db}+\epsilon}}b=b−αSdb​+ϵ​db​

取ϵ=10−8\epsilon=10^{-8}ϵ=10−8,目的是防止你除以0或者一个很小的数。

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2018年12月05日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • RMSprop
    • RMSprop计算方法
    领券
    问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档