前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >[DeeplearningAI笔记]序列模型1.3-1.4循环神经网络原理与反向传播公式

[DeeplearningAI笔记]序列模型1.3-1.4循环神经网络原理与反向传播公式

作者头像
演化计算与人工智能
发布2020-08-14 14:30:26
3830
发布2020-08-14 14:30:26
举报

5.1 循环序列模型

吴恩达老师课程原地址[1]

1.3 循环神经网络模型

为什么不使用标准的神经网络
  • 假如将九个单词组成的序列作为输入,通过普通的神经网网络输出输出序列,
    • 例如普通神经网络可以学习到 Harry 这个单词出现在
    x^{<1>}

    的位置,但是如果 Harry 这个单词出现在

    x^{<4>}

    的位置,普通的神经网络不能识别的出来。

    • 也许每个语句都有最大长度,能够通过 Padding 的方式填充数据,但总体来说不是一个好的表达方式。
    1. 在不同的例子中输入数据和输出数据具有不同的长度,即每个数据不会有一样的长度
    2. 不共享从文本的不同位置上学到的特征
    3. 输入量巨大,如果词典中最大的单词量是 1W 的话,则单词的 one-hot 表示向量将是一个 1W 维的数据。而一个训练语句中的单词数为
    T_{x}

    ,则输入数据的维度为

    T_{x} * 1W

    此数据维度是十分巨大的。

循环神经网络模型
简化循环神经网络数学公式
  • W_{aa}和W_{ax}合并成一个大的矩阵W_{a},将a^{}和X^{}合并成[a^{},X^{}] 具体如下图所示:

1.4 通过时间的反向传播 Backpropagation through time

参考资料

[1]

吴恩达老师课程原地址: https://mooc.study.163.com/smartSpec/detail/1001319001.ht

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-05-28,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DrawSky 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 5.1 循环序列模型
    • 1.3 循环神经网络模型
      • 1.4 通过时间的反向传播 Backpropagation through time
      领券
      问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档