前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >深度学习优化算法Momentum RMSprop Adam

深度学习优化算法Momentum RMSprop Adam

作者头像
10JQKA
发布2018-05-09 14:46:58
5160
发布2018-05-09 14:46:58

一、Momentum

1. 计算dw、db.

2. 定义v_db、v_dw

\[ v_{dw}=\beta v_{dw}+(1-\beta)dw \] \[ v_{db}=\beta v_{db}+(1-\beta)db \]

3. 更新dw、db

\[ dw=w-\alpha v_{dw} \] \[ db=b-\alpha v_{db} \]

二、RMSprop

1. 计算dw、db.

2. 定义s_db、s_dw (这里的平方是元素级的)

\[ s_{dw}=\beta s_{dw}+(1-\beta)dw^2 \] \[ s_{db}=\beta s_{db}+(1-\beta)db^2 \]

3. 更新dw、db

\[ dw=w-\alpha \frac{w}{\sqrt{s_{dw}}} \] \[ db=b-\alpha \frac{b}{\sqrt{s_{db}}} \]

三、Adam

==结合了Momentum+RMSprop==

1. 计算dw、db.

2. 定义v_db、v_dw、s_db、s_dw.

\[ v_{dw}=\beta_{1} v_{dw}+(1-\beta_{1})dw \] \[ v_{db}=\beta_{1} v_{db}+(1-\beta_{1})db \] \[ s_{dw}=\beta_{2} s_{dw}+(1-\beta_{2})dw^2 \] \[ s_{db}=\beta_{2} s_{db}+(1-\beta_{2})db^2 \]

3. 纠偏(t为迭代次数)

\[ v_{dw}^{correct}=\frac{v_{dw}}{1-\beta^t} \] \[ v_{db}^{correct}=\frac{v_{db}}{1-\beta^t} \] \[ s_{dw}^{correct}=\frac{s_{dw}}{1-\beta^t} \] \[ s_{db}^{correct}=\frac{s_{db}}{1-\beta^t} \]

4. 更新dw、db,e为很小的数,防止分母为0。

通常(e=10^-8)

\[ dw=w-\alpha \frac{v_{dw}^{correct}}{\sqrt{s_{dw}^{correct}}+e} \] \[ db=b-\alpha \frac{v_{db}^{correct}}{\sqrt{s_{db}^{correct}}+e} \]

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2018-01-06 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、Momentum
    • 1. 计算dw、db.
      • 2. 定义v_db、v_dw
        • 3. 更新dw、db
        • 二、RMSprop
          • 1. 计算dw、db.
            • 2. 定义s_db、s_dw (这里的平方是元素级的)
              • 3. 更新dw、db
              • 三、Adam
                • ==结合了Momentum+RMSprop==
                  • 1. 计算dw、db.
                    • 2. 定义v_db、v_dw、s_db、s_dw.
                      • 3. 纠偏(t为迭代次数)
                        • 4. 更新dw、db,e为很小的数,防止分母为0。
                        领券
                        问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档