前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【免费线上实践】动手训练模型系列:梯度消失

【免费线上实践】动手训练模型系列:梯度消失

作者头像
SIGAI学习与实践平台
发布2018-12-17 11:40:13
5721
发布2018-12-17 11:40:13
举报

本模型实现对512*512图像的像素二分类问题;红色或蓝色的样本点(每个样本包含坐标(x,y)值)坐落在对应颜色的区域内则样本正确分类,反之分类错误。 loss值采用Cross_entropy计算,表征训练/测试样本与实际训练/测试分类结果误差的汇总。

操作介绍:

点击不同按钮,"2个隐含层" "4个隐含层" "6隐含层",模型结构自动调整

模型结构:

ANN人工神经网络, 2-6个FC隐含层,神经元个数均为4个

(进入小程序 动手训模型)

模型训练小结:

梯度消失在深度神经网络训练中极为常见.神经网络训练中,每个网络层都会针对Loss值反向传播计算出该层的梯度,并根据梯度逐次迭代修正本层weight,最终每层weight都得到相对正确的值即可完成训练.但是,当基于Loss值计算出的梯度值<1,且神经网络层数过多时,梯度值按照链式法则连续相乘,最终浅层网络得到的梯度值会出现接近于0的情况.这种情况一旦出现,则浅层网络的Weight将停止修改,即发生梯度消失.本项目提供三个不同深度的ANN人工神经网络.针对相同样本集,分别训练,观察不同深度模型中梯度消失现象的发生。

如果模型的深度相对于样本特征的复杂度过深,则浅层的梯度值始终为0难以迭代,易出现梯度消失问题,导致模型无法正确完成任务。

模型参数备注:

训练样本规模:50 测试样本规模:400 激活函数Activation:Sigmoid 正则化策略Regularization:None 学习率Learning rate:0.1 Batch Size:1 Epoch迭代次数:1000

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-11-19,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 SIGAI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
云开发 CloudBase
云开发(Tencent CloudBase,TCB)是腾讯云提供的云原生一体化开发环境和工具平台,为200万+企业和开发者提供高可用、自动弹性扩缩的后端云服务,可用于云端一体化开发多种端应用(小程序、公众号、Web 应用等),避免了应用开发过程中繁琐的服务器搭建及运维,开发者可以专注于业务逻辑的实现,开发门槛更低,效率更高。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档