开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

社区首页 >专栏 >NLP（3）——seq to seq

NLP（3）——seq to seq

DC童生

发布于 2018-07-24 15:22:42

1.4K0

发布于 2018-07-24 15:22:42

举报

文章被收录于专栏：机器学习原理

什么是Seq2Seq网络？在Seq2Seq模型中采用了这种 Encoder-Decoder架构，其中 Encoder 是一个RNNCell（RNN ，GRU，LSTM 等）结构，四层的LSTM结构使得能够提取足够多的特征，使得decode的模型变好
几种Seq2Seq模式 1.学霸模式

2.普通作弊

image.png 3.学弱作弊

普通作弊的基础上，回顾上一刻的答案 4.学渣作弊（attention机制）

上课的时候划重点

应用场景只要是序列到序列都可以用
attention机制是怎么引入的？

image.png 第一步

第二步：

第三步：

seqtoseq损失函数损失函数为交叉熵损失函数，一般情况下，深度学习最后用softmax最为分类器一般都会选择用交叉熵损失函数

本文参与腾讯云自媒体同步曝光计划，分享自作者个人站点/博客。

原始发表：2018.07.20 ，如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自作者个人站点/博客前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

评论

登录后参与评论

0 条评论

热度

最新

LV.