前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >02.改善深层神经网络:超参数调试、正则化以及优化 W2.优化算法

02.改善深层神经网络:超参数调试、正则化以及优化 W2.优化算法

作者头像
Michael阿明
发布2021-02-19 14:38:22
2240
发布2021-02-19 14:38:22
举报
文章被收录于专栏:Michael阿明学习之路

文章目录

参考: 吴恩达视频课 深度学习笔记

1. Mini-batch 梯度下降

在巨大的数据集上进行训练,速度非常慢,如何提高效率?

前面我们学过向量化可以较快的处理整个训练集的数据,如果样本非常的大,在进行下一次梯度下降之前,你必须完成前一次的梯度下降。如果我们能先处理一部分数据,算法速度会更快。

  • 把训练集分割为小一点的子集(称之 mini-batch)训练

batch 梯度下降法:指的就是前面讲的梯度下降法,可以同时处理整个 训练集 mini-batch:每次处理的是单个的 mini-batch 训练子集

2. 理解 mini-batch 梯度下降

在这里插入图片描述
在这里插入图片描述

mini-batch 梯度下降,每次迭代后 cost 不一定是下降的,因为每次迭代都在训练不同的样本子集,但总体趋势应该是下降的

mini-batch 的 size 大小:

  • 大小 = m,就是batch梯度下降法
  • 大小 = 1,就是随机梯度下降
mini-batch size
mini-batch size

3. 指数加权平均数

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

4. 理解指数加权平均数

在这里插入图片描述
在这里插入图片描述

5. 指数加权平均的偏差修正

偏差修正
偏差修正

6. 动量Momentum梯度下降法

思想:计算梯度的指数加权平均数,利用该梯度更新权重

在这里插入图片描述
在这里插入图片描述

上图情况下,标准的梯度下降会上下波动,且要使用较小的学习率,否则会偏离更远。

如果我们使用过去梯度的加权平均,纵向的就抵消了一些,横向的叠加了一些,可以更平滑的快速找向最优点

RMSpropMomentum 有很相似的一点,可以消除梯度下降和mini-batch梯度下降中的摆动,并允许你使用一个更大的学习率,从而加快你的算法学习速度。

8. Adam 优化算法

Adam (Adaptive Moment Estimation) 优化算法基本上就是将 Momentum 和 RMSprop 结合在一起

Adam算法结合了 Momentum 和 RMSprop 梯度下降法,并且是一种极其常用的学习算法 其被证明能有效适用于不同神经网络,适用于广泛的结构

超参数:

9. 学习率衰减

慢慢减少 学习率 的本质在于,在学习初期,使用较大的步伐,开始收敛的时候,用小一些的学习率能让步伐小一些

  • 对不同的 mini-batch 进行训练,一次称之为 epoch

还有离散下降学习率,即 不是每步都下调学习率

10. 局部最优的问题

高维度空间中,我们不太可能遇见(概率很低)如上图所示的局部最优点,因为需要这么多的维度方向上都梯度为 0(概率很低)

所以更有可能遇到的是鞍点

基本不会遇见局部最优问题,可能遇见的是平稳段减缓了学习速度,该区域梯度接近于 0 ,要很长时间才能走出去。Momentum 或 RMSprop,Adam 能够加快速度,让你尽早 走出平稳段。

平稳段
平稳段
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2020/09/08 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 文章目录
  • 1. Mini-batch 梯度下降
  • 2. 理解 mini-batch 梯度下降
  • 3. 指数加权平均数
  • 4. 理解指数加权平均数
  • 5. 指数加权平均的偏差修正
  • 6. 动量Momentum梯度下降法
  • 8. Adam 优化算法
  • 9. 学习率衰减
  • 10. 局部最优的问题
相关产品与服务
批量计算
批量计算(BatchCompute,Batch)是为有大数据计算业务的企业、科研单位等提供高性价比且易用的计算服务。批量计算 Batch 可以根据用户提供的批处理规模,智能地管理作业和调动其所需的最佳资源。有了 Batch 的帮助,您可以将精力集中在如何分析和处理数据结果上。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档