前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >[DeeplearningAI笔记]序列模型3.2有条件的语言模型与贪心搜索的不可行性

[DeeplearningAI笔记]序列模型3.2有条件的语言模型与贪心搜索的不可行性

作者头像
演化计算与人工智能
发布2020-08-14 15:05:13
5340
发布2020-08-14 15:05:13
举报

3.2 选择最可能的句子 Picking the most likely sentence

condition language model 有条件的语言模型
  • 对于 语言模型 ,能够估计出这些单词是一个句子的可能性,也可以用其生成一个新的句子。
  • 对于 机器翻译模型 使用绿色表示 编码网络 ,使用 紫色表示 解码网络
  • 会发现 解码网络语言模型 几乎一模一样,只是在普通的语言模型中输入的向量
a^{<0>}

是 0 向量,但是在机器翻译模型中 decoder 的输入是 encoder 的输出。所以称机器翻译中的 decodercondition language model 有条件的语言模型

  • 通过机器翻译模型,模型会告诉你各种翻译所对应的可能性--即 P(y^{<1>},...,y^{}|x)P(y^{<1>},...,y^{}|x)
贪心搜索(Greedy Search)的不可行性
  • 生成第一个词的分布以后,它会根据你的条件语言模型挑选出最有可能的第一个词,进入机器翻译模型中,在挑选出第一个词后,它会继续挑选出第二个最有可能的词,然后继续挑选出第三个最有可能的词,这种算法就叫做 贪心搜索
  • 但是你真正需要的是整个单词序列从 y^{<1>},y^{<2>},...,y^{}
  • 对于句子:[1] “Jane is visiting Africa in September” [2] "Jane is going to be visiting Africa in September" 很明显第一个句子的翻译更好,因为第一句话相对于第二句话来说更加简洁。
  • 首先翻译出 Jane is 在英语中 going to 相对于 visiting 出现频率更多,如果使用 贪心搜索 方法,则有更高的概率会选择 going to 作为翻译的结果。这样得到的翻译结果并不是最佳的。
  • Note 所以此时应该考虑一种近似全局的搜索方式,从词典中挑选需要单词的组合近似的使 条件概率最大

参考资料

[1]

吴恩达老师课程原地址: https://mooc.study.163.com/smartSpec/detail/1001319001.htm

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-06-01,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DrawSky 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 3.2 选择最可能的句子 Picking the most likely sentence
    • condition language model 有条件的语言模型
      • 贪心搜索(Greedy Search)的不可行性
      • 参考资料
      相关产品与服务
      机器翻译
      机器翻译(Tencent Machine Translation,TMT)结合了神经机器翻译和统计机器翻译的优点,从大规模双语语料库自动学习翻译知识,实现从源语言文本到目标语言文本的自动翻译,目前可支持十余种语言的互译。
      领券
      问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档