前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >深度神经网络之反向传播算法

深度神经网络之反向传播算法

作者头像
小一
发布2019-08-14 15:45:57
7070
发布2019-08-14 15:45:57
举报
文章被收录于专栏:谓之小一谓之小一
1.DNN反向传播算法简介

现在对应到我们的DNN模型之中,即输入层有n_in个神经元,输出层有n_out个神经元,再加上一些含有若干个神经元的隐含层。此时我们需要找到所有隐含层和输出层所对应的线性系数矩阵W、偏倚向量b,希望通过DNN对所有的训练样本计算后,计算结果能够等于或很接近样本输出,当有新的测试样本数据时,能够有效预测样本输出。但怎样找到合适的线形系数矩阵W和偏倚变量b呢?

回顾我们前面学习的机器学习之Logistic回归机器学习之SVM支持向量机等机器学习算法,很容易联想到,我们可以用一个合适的损失函数来度量训练样本的输出损失。然后对损失函数优化,求损失函数最小化的极值,此时对应的线性系数矩阵W,偏倚变量b便是我们希望得到的结果。深度神经网络中,损失函数优化极值求解的过程,通常是利用梯度下降法迭代完成的。当然也可以利用其他的迭代方法,比如牛顿法或拟牛顿法。梯度下降算法以前在机器学习之线形回归中有过详细介绍,有兴趣可以回顾一下。

对DNN损失函数用梯度下降法进行迭代优化求极小值的过程,便是我们的反向传播算法(Back Propagation,BP)

2.DNN反向传播算法数学推导

进行DNN反向传播算法之前,我们需要选择一个损失函数,来度量计算样本的输出和真实样本之间的损失。但训练时的计算样本输出怎么得到呢?

通过损失函数,我们能够用梯度下降法来迭代求解每一层的W,b。首先计算的是输出层,其中输出层的W,b满足下式

3.DNN反向传播算法过程

梯度下降算法有批量(Batch),小批量(Mini-Batch),随机三种方式,采用哪种方式取决于我们的问题而定。为简化描述,这里采用最基本的批量梯度下降法来描述反向传播算法。

通过深度神经网络之中的前向传播算法和反向传播算法的结合,我们能够利用DNN模型去解决各种分类或回归问题,但对于不同问题,效果如何呢?是否会过拟合呢?我们将在下次文章中详细介绍损失函数和激活函数的选择、正则化方面的知识点,来让深度神经网络能更精确的解决我们的问题。

参考

刘建平Pinard_深度神经网络(DNN)反向传播算法(BP)

你看到的这篇文章来自于公众号「谓之小一」,欢迎关注我阅读更多文章。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-06-28,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 谓之小一 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 2.DNN反向传播算法数学推导
  • 3.DNN反向传播算法过程
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档