首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >循环神经网络RNN原理梳理

循环神经网络RNN原理梳理

作者头像
lovelife110
发布2021-01-14 14:43:35
发布2021-01-14 14:43:35
3960
举报
文章被收录于专栏:爱生活爱编程爱生活爱编程

RNN结构

上图为Tx​=Ty,T为序列长度,

表示输入x的第t个时间步, Tx​=Ty的体系结构可以是提取句子中人名,例如句子“小明去学校”,句子中每个词先调整为one-hot编码,然后

为标签,0代表不是人名,1代表是。或者通过已有一堆英文人名,构建字符级语言模型来生成新的名称。

前向传播

上图为计算公式,其中

代表权重,前面a代表计算的是激活值

,x代表权重后面跟的是

首先先通过RNN的前向传播,如果输入的数据序列经过10个时间步,那么将复制RNN单元10次,每个单元将前一个单元中的隐藏状态

和当前时间步的输入数据

作为输入。 它为此时间步输出隐藏状态

和预测

RNN反向传播

循环神经网络可以看作是单元的重复,首先要实现单个时间步的计算

就像在完全连接的神经网络中一样,成本函数J的导数通过链式法则计算,通过RNN向后传播。

链式法则通过计算

来更新Wax,Waa,ba

更新参数

更新Wax、Waa、Wya、ba、by

模型结构总结

模型的结构如下:

  • 初始化参数
  • 循环:
    • 前向传播计算损失
    • 反向传播计算关于损失的梯度
    • 修剪梯度以免梯度爆炸
    • 用梯度下降更新规则更新参数。
  • 返回学习后了的参数
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2019/09/27 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • RNN结构
  • 前向传播
  • RNN反向传播
  • 更新参数
  • 模型结构总结
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档