前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >《深度学习Ng》课程学习笔记02week3——超参数调试、Batch正则化和程序框架

《深度学习Ng》课程学习笔记02week3——超参数调试、Batch正则化和程序框架

作者头像
小爷毛毛_卓寿杰
发布2018-04-18 16:46:59
5090
发布2018-04-18 16:46:59
举报
文章被收录于专栏:Soul Joy HubSoul Joy Hub

http://blog.csdn.net/u011239443/article/details/78088602

3.1 调试处理

  • 参数:

- 不要使用格子点调参,而应该使用随机点调参。因为格子点对于单一粒度

  • 调参时,我们可以先调参选到几个结果较优的点(如图被蓝色圈住的)

3.2 为超参数选择合适的范围

对于 alpha 的取值:

我们不应该如上述的方法取值,而应先划分(如下),再取值:

3.3 超参数训练的实践:Pandas VS Caviar

3.4 正则化网络的激活函数

输入的0均值标准化:

隐藏层的0均值标准化:

3.5 将 Batch Norm 拟合进神经网络

  • 使用微批:
  • 梯度下降:

3.6 Batch Norm 为什么奏效?

当训练集中X发布改变的时候,需要重新训练模型:

我们吧某隐藏层之后的神经网络看成一个模型,可知就算是同分布的数据X从整个网络正向传播,由于W、b的变化,到了该隐藏层,输出分布也都会不同。所以Batch Norm 奏效就是由于避免的这种分布的不同而造成的问题:

3.7 测试时的 Batch Norm

3.8 Softmax 回归

最终预测的各个类别的概率之和不一定等于1:

3.9 训练一个 Softmax 分类器

  • 损失函数:
  • 梯度下降:

3.10 深度学习框架

3.11 TensorFlow

参阅:TensorFlow实战——入门

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2017年09月25日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 3.1 调试处理
  • 3.2 为超参数选择合适的范围
  • 3.3 超参数训练的实践:Pandas VS Caviar
  • 3.4 正则化网络的激活函数
  • 3.5 将 Batch Norm 拟合进神经网络
  • 3.6 Batch Norm 为什么奏效?
  • 3.7 测试时的 Batch Norm
  • 3.8 Softmax 回归
  • 3.9 训练一个 Softmax 分类器
  • 3.10 深度学习框架
  • 3.11 TensorFlow
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档