首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >[DeeplearningAI笔记]序列模型3.1基本的 Seq2Seq /image to Seq

[DeeplearningAI笔记]序列模型3.1基本的 Seq2Seq /image to Seq

作者头像
演化计算与人工智能
发布2020-08-14 14:41:00
8350
发布2020-08-14 14:41:00
举报

3.1 基础模型

“[1] Sutskever I, Vinyals O, Le Q V. Sequence to Sequence Learning with Neural Networks[J]. 2014, 4:3104-3112. [2] Cho K, Van Merrienboer B, Gulcehre C, et al. Learning Phrase Representations using RNN Encoder-Decoder for Statistical Machine Translation[J]. Computer Science, 2014.

seq2seq
  • 示例 对于法语句子: Jane visite l'Afrique en septembre 翻译成英语为 : Jane is visiting Africa in September
  • 对于输入句子使用
x^{<1>},x^{<2>},x^{<3>},x^{<4>},x^{<5>}

来表示输入句子的单词,使用

y^{<1>},y^{<2>},y^{<3>},y^{<4>},y^{<5>},y^{<6>}

来表示输出句子的单词。

  • 首先建立 编码网络 encoder network 它是一个 RNN 结构,RNN 的子结构可以是 GRU 或者 LSTM,每次向网络中输入一个单词,将输入序列接收完毕后,这个 RNN 会输出一个向量来代表这个输入序列。
  • 之后你可以建立一个 解码网络 decoder network 它以编码网络的输出作为输入。解码网络 可以被训练为每次输出一个翻译后的单词,一直到它输出序列的结尾或者句子结尾标记,解码网络工作结束。
  • 和介绍 RNN 时一样,解码网络 将前一个时间步的输出作为输入进行该时间步的预测。
  • 这个模型简单地使用一个编码网络对输入的法语句子进行编码,然后用一个解码网络来生成对应的英语翻译

“[1] Mao J, Xu W, Yang Y, et al. Deep Captioning with Multimodal Recurrent Neural Networks (m-RNN)[J]. Eprint Arxiv, 2015. [2] Vinyals O, Toshev A, Bengio S, et al. Show and tell: A neural image caption generator[C]// IEEE Conference on Computer Vision and Pattern Recognition. IEEE Computer Society, 2015:3156-3164. [3] Karpathy A, Li F F. Deep visual-semantic alignments for generating image descriptions[C]// Computer Vision and Pattern Recognition. IEEE, 2015:3128-3137.

Image captioning 图片描述 image to Sequence model
  • 类似的结构也可以被用来做 图片描述(Image captioning) , 给出一张图片,他能自动地输出该图片的描述。

A cat sitting on a chair

  1. 首先,使用 CNN 学习图片的一系列特征,并输出图片的编码。
  1. 去掉末端的 softmax 单元,可以得到一个 4096 维的向量来表示这张图片
  2. 接着可以把这个向量输入到 RNN 中,RNN 通过每次生成一个单词的形式输出该图片的描述。事实证明,这种方法十分有效,特别是当输出的描述图片的句子不是特别长的时候

参考资料

[1]

吴恩达老师课程原地址: https://mooc.study.163.com/smartSpec/detail/1001319001.htm

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-06-01,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DrawSky 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 3.1 基础模型
    • seq2seq
      • Image captioning 图片描述 image to Sequence model
      • 参考资料
      领券
      问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档