前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >了解《语音识别》必看的6篇论文【附打包下载地址】

了解《语音识别》必看的6篇论文【附打包下载地址】

作者头像
马上科普尚尚
发布2020-09-04 14:40:14
4620
发布2020-09-04 14:40:14
举报
文章被收录于专栏:人工智能前沿讲习

论文推荐

“ 《SFFAI 78期-语音识别专题》来自中科院自动化研究所的田正坤同学推荐的文章主要关注于语音识别领域,你可以认真阅读讲者推荐的论文,来与讲者及同行线上交流哦。”

关注文章公众号

回复"SFFAI78"获取本主题精选论文

01

推荐理由:本文介绍单调注意力机制,通过限制注意力机制的单调性,实现了语音识别的流式解码。

—— 田正坤

02

推荐理由:本文的思路与百度SMLTA相似,利用CTC的尖峰对编码序列进行切分,在切分块上计算注意力机制来实现流式解码。

—— 田正坤

03

推荐理由:本文是信息累积的思路。通过判断是否达到触发的阈值,如果达到阈值则在当前位置进行切分,如果没有达到阈值,则记录当前位置所包含的信息量,然后跳转到下一时刻并重复上述计算。

—— 田正坤

04

推荐理由:本文通过逐块解码的方式来实现流式解码,将编码序列切分为等长的块,在块内进行注意力的计算,如果预测得到空格标记则表示当前块解码完成,并跳转到下一个块,重复上述计算直到最后一个块解码结束。

—— 田正坤

05

推荐理由:本文最先将非递归网络引入语音识别任务,并提出了使用两种非递归网络的解码思路。

—— 田正坤

06

推荐理由:本文将CTC模型引入非递归网络的计算中,使用CTC的尖峰来预测目标序列的长度,并辅助模型收敛。

—— 田正坤

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-09-02,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 人工智能前沿讲习 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
语音识别
腾讯云语音识别(Automatic Speech Recognition,ASR)是将语音转化成文字的PaaS产品,为企业提供精准而极具性价比的识别服务。被微信、王者荣耀、腾讯视频等大量业务使用,适用于录音质检、会议实时转写、语音输入法等多个场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档