前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >NLP: Text Neural Network (Part2: Seq2Seq)

NLP: Text Neural Network (Part2: Seq2Seq)

作者头像
JiahuiZhu1998
修改2023-06-20 11:16:29
1550
修改2023-06-20 11:16:29
举报

Seq2Seq Definition

简称 "序列到序列"模型,使用Encoder-Decoder结构,Encoder用来分析Input Sequence,Decoder用于生成Output Sequence; 使用两个RNN

seq2seq模型
seq2seq模型

Encoder 编码器

Encoder 将 不定长input转换成 定长的 Context Variable which is c, 并且在c中输入sequence信息

常用 Encoder 是 RNN

RNN Hidden Layer转换
RNN Hidden Layer转换
计算 Context Variable
计算 Context Variable

Decoder 解码器

Decoder 计算,s代表state当前状态
Decoder 计算,s代表state当前状态
通过output y 和 Context c 生成条件概率
通过output y 和 Context c 生成条件概率

Training 模型训练

最大似然估计计算 Input Sequence 条件概率

计算 Input Sequence 条件概率
计算 Input Sequence 条件概率

损失函数 Loss Function

Loss Function of Seq2Seq
Loss Function of Seq2Seq

Seq2Seq 模型预测

Greedy Search 贪婪搜索

从 |Y| 个词中搜索出条件概率最大的词

贪婪搜索计算条件概率,算出output y
贪婪搜索计算条件概率,算出output y
通过output 计算output sequence
通过output 计算output sequence

Greedy Search 贪婪搜索例子

每次选取概率最大的词,输出序列条件概率为 0.5 * 0.4 * 0.4 * 0.6 = 0.048,输出序列 ABC<eos>
每次选取概率最大的词,输出序列条件概率为 0.5 * 0.4 * 0.4 * 0.6 = 0.048,输出序列 ABC<eos>
图中例子 序列条件概率为 0.5 * 0.3 * 0.6 * 0.6 = 0.054 大于 0.048,说明贪婪搜索输出的不是最好的
图中例子 序列条件概率为 0.5 * 0.3 * 0.6 * 0.6 = 0.054 大于 0.048,说明贪婪搜索输出的不是最好的

穷举搜索

将所有可能的条件概率全都计算一遍; 计算开销过大

Beam Search 束搜索

Bean Search 是对 Greedy Search的优化方案

设置 Beam Size = k,选取k个条件概率最大的词,组成 候选输出概率首词

Beam Search 图解
Beam Search 图解
output sequence 计算公式,L是最终候选序列长度,alpha一般为0.75
output sequence 计算公式,L是最终候选序列长度,alpha一般为0.75

Bleu得分

BLEU 是 Bilingual Evaluation Understudy 双语评估替补

Bleu 概率计算
Bleu 概率计算
Bleu 公式
Bleu 公式

此处,k代表希望匹配的字序列的最大词数

本文系转载,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文系转载前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Seq2Seq Definition
  • Encoder 编码器
  • Decoder 解码器
  • Training 模型训练
    • 最大似然估计计算 Input Sequence 条件概率
      • 损失函数 Loss Function
      • Seq2Seq 模型预测
        • Greedy Search 贪婪搜索
          • Greedy Search 贪婪搜索例子
            • 穷举搜索
              • Beam Search 束搜索
              • Bleu得分
              领券
              问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档