RMSprop

hotarugali

发布于 2022-03-10 15:06:42

4050

发布于 2022-03-10 15:06:42

文章被收录于专栏：hotarugaliの技术分享hotarugaliの技术分享

1. 简介

RMSprop 算法是 AdaGrad 算法的改进，可以在有些情况下避免 AdaGrad 算法中学习率不断单调下降以至于过早衰减的缺点。

2. 原理

第 t 次迭代时：

RMSprop 算法首先计算每次迭代梯度 \frac{\partial L}{\partial \boldsymbol{W}} 平方的指数衰减移动平均：

\begin{array}{c} \boldsymbol{h}_t = \beta \boldsymbol{h}_{t-1} + (1-\beta)\frac{\partial L}{\partial \boldsymbol{W}_{t-1}} \odot \frac{\partial L}{\partial \boldsymbol{W}_{t-1}} \end{array}

其中，\beta 为衰减率，一般取指为 0.9 。

RMSprop 算法的参数更新公式为：

\begin{array}{c} \boldsymbol{W}_t = \boldsymbol{W}_{t-1} - \eta \frac{1}{\sqrt{\boldsymbol{h}_t+\boldsymbol{\varepsilon}}} \frac{\partial L}{\partial \boldsymbol{W}_{t-1}} \end{array}

其中，\boldsymbol{W} 为需要更新的参数，L 为损失函数，\frac{\partial L}{\partial \boldsymbol{W}} 为L 关于 \boldsymbol{W} 的梯度，\eta 为学习率，\odot 表示对应矩阵元素的乘法，\boldsymbol{\varepsilon} 是为了保持数值稳定而设置的非常小的常数（一般取 e^{-7} 到 e^{-10} ）。

本文参与腾讯云自媒体同步曝光计划，分享自作者个人站点/博客。

原始发表：2020-10-17，如有侵权请联系 cloudcommunity@tencent.com 删除

编程算法

本文分享自作者个人站点/博客前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

编程算法

登录后参与评论

0 条评论

热度

RMSprop

RMSprop

1. 简介

2. 原理

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐