开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

社区首页 >专栏 >《深度学习Ng》课程学习笔记02week3——超参数调试、Batch正则化和程序框架

《深度学习Ng》课程学习笔记02week3——超参数调试、Batch正则化和程序框架

作者头像

小爷毛毛_卓寿杰

发布于 2018-04-18 16:46:59

5310

发布于 2018-04-18 16:46:59

举报

文章被收录于专栏：Soul Joy Hub

http://blog.csdn.net/u011239443/article/details/78088602

3.1 调试处理

参数：

- 不要使用格子点调参，而应该使用随机点调参。因为格子点对于单一粒度

调参时，我们可以先调参选到几个结果较优的点（如图被蓝色圈住的）

3.2 为超参数选择合适的范围

对于 alpha 的取值：

我们不应该如上述的方法取值，而应先划分（如下），再取值：

3.3 超参数训练的实践：Pandas VS Caviar

3.4 正则化网络的激活函数

输入的0均值标准化：

隐藏层的0均值标准化：

3.5 将 Batch Norm 拟合进神经网络

使用微批：

梯度下降：

3.6 Batch Norm 为什么奏效？

当训练集中X发布改变的时候，需要重新训练模型：

我们吧某隐藏层之后的神经网络看成一个模型，可知就算是同分布的数据X从整个网络正向传播，由于W、b的变化，到了该隐藏层，输出分布也都会不同。所以Batch Norm 奏效就是由于避免的这种分布的不同而造成的问题：

3.7 测试时的 Batch Norm

3.8 Softmax 回归

最终预测的各个类别的概率之和不一定等于1：

3.9 训练一个 Softmax 分类器

损失函数：

梯度下降：

3.10 深度学习框架

3.11 TensorFlow

参阅：TensorFlow实战——入门

本文参与腾讯云自媒体同步曝光计划，分享自作者个人站点/博客。

原始发表：2017年09月25日，如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自作者个人站点/博客前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

评论

登录后参与评论

0 条评论

热度

最新

LV.

目录

3.1 调试处理
3.2 为超参数选择合适的范围
3.3 超参数训练的实践：Pandas VS Caviar
3.4 正则化网络的激活函数
3.5 将 Batch Norm 拟合进神经网络
3.6 Batch Norm 为什么奏效？
3.7 测试时的 Batch Norm
3.8 Softmax 回归
3.9 训练一个 Softmax 分类器
3.10 深度学习框架
3.11 TensorFlow