ShowMeAI为斯坦福CS224n《自然语言处理与深度学习(Natural Language Processing with Deep Learning)》课程的全部课件,做了中文翻译和注释,并制作成了GIF动图!视频和课件等资料的获取方式见文末。
(语言模型相关内容也可以参考ShowMeAI对吴恩达老师课程的总结文章深度学习教程 | 序列模型与RNN网络)
训练一个(条件)RNN语言模型
解码算法
贪婪解码
集束搜索解码
束搜索解码
正确
在单文档摘要,数据集中的源文档具有不同长度和风格
句子简化是一个不同但相关的任务:将源文本改写为更简单 (有时是更短) 的版本
类似于 BLEU,是基于 n-gram 覆盖的算法,不同之处在于:
include
/ don’t-include
don’t-include
的单词 (使用 mask) don’t-include
的单词,所以模型必须学会跳过这些单词并将那些 include
的单词进行摘要与组合 对话
包括各种各样的设置
(seq2seq相关内容也可以参考ShowMeAI的NLP教程NLP教程(6) - 神经机器翻译、seq2seq与注意力机制,以及对吴恩达老师课程的总结文章深度学习教程 | Seq2Seq序列模型和注意力机制)
我不知道
)Fan 等也提出了一个复杂的 seq2seq prompt-to-story 模型
缺失的是什么?
情感和可读性
Non-autoregressive 神经机器翻译
模型基于词重叠的指标 (BLEU,ROUGE,METROR,F1,等等)
聊天机器人非常吸引人,因为它总是回写
) 发现
可以点击 B站 查看视频的【双语字幕】版本
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。