【教程】语音识别中的End-to-End模型教程(附178页PDF全文下载)

【导读】Interspeech是由国际语音通信协会ISCA(International Speech Communication Association)组织的语音研究领域的顶级会议之一,是全球最大的综合性语音信号处理领域的科技盛会,该会议每年举办一次,每次都会吸引全球语音信号领域以及人工智能领域知名学者、企业以及研发人员参加。本期内容为大家整理了google研究人员Rohit Prabhavalkar在大会上的端到端语音识别模型教程,希望对大家有所帮助。

介绍:

传统的语音识别系统是由一组独立的构件组成,即声学模型(AM)、语音模型(PM)、语言模型(LM)。其中AM输入以声学特征为主(通常是上下文相关的音素),以预测subword单元的分布;PM一般情况是人工设计的词典集合,它将声学模型产生的subword单元序列映射到单词上;最终,通过LM构件对各种词的概率进行计算,得到文本序列。

在传统的自动语音识别系统中,这些构件是在不同数据集上独立训练的,并且有一些独立的假设以方便处理。而在过去的几年里,人们对开发端到端的语音识别系统越来越感兴趣,这些系统试图在单个系统中完成多个构件的工作。例如基于attention的模型、循环神经传感器、循环神经校准器、目标词时序分类等。这些模型的共同特点在于,它们组成在一个单一的神经网络上,当接收一段语音信息后,直接输出一组图形或文字的概率分布。随着研究的逐渐深入,这种端到端的模型可以超过传统自动语音识别系统的性能。

在本教程中,我们将详细介绍自动语音识别中的端到端建模方案,从这些系统的历史发展开始,同时分析这些方法的共性和区别;进而,我们将讨论一些最近的创新工作,这些创新极大地改进了端到端模型的性能,使它们能够超过传统的自动语音识别系统的性能;然后,本教程将描述这项研究的一些令人兴奋的应用,以及一些可能的研究方向;最终,我们将讨论端到端模型现在存在的问题,以及将来所面临的挑战。

请关注专知公众号(扫一扫最下面专知二维码,或者点击上方蓝色专知)

  • 后台回复“EESR” 就可以获取全文报告 PDF下载链接~

附PDF全文:

-END-

原文发布于微信公众号 - 专知(Quan_Zhuanzhi)

原文发表时间:2018-11-21

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器之心

入门 | 做数据科学如烤蛋糕?不服来看

面部识别、自动驾驶、机器人统治世界?!还有那个令人毛骨悚然的机器人女孩,索菲亚。emmm…还有黑镜?

1332
来自专栏人工智能快报

科学家研制出具有更好自学能力的计算机

物理研究门户网站phys.org发文称科学家开发出了一种基于神经启发的模拟计算机,它能够在执行任务时通过自我训练将自己变得更好。这个基于一种名为“储备池计算”的...

2806
来自专栏CSDN技术头条

整理:深度学习 vs 机器学习 vs 模式识别

本文来自CMU的博士,MIT的博士后,vision.ai的联合创始人Tomasz Malisiewicz的个人博客文章,阅读本文,你可以更好的理解计算机视觉是怎...

19210
来自专栏程序你好

什么是机器学习和人工智能以及它们之间的差异

机器学习和人工智能的区别:“好的,谷歌!有什么事吗?你能演奏我最喜欢的曲目或者预订一辆从宫殿路到MG路的出租车吗?”

941
来自专栏人工智能头条

AI 迟早灭了程序员

就目前的 AI 来看,判断某项工作是不是会被机器替代,有俩前提,大前提:可以获得足够的有效数据(能自动生成数据则无敌),也就是说机器有快速进化的基础;小前提:人...

722
来自专栏企鹅号快讯

哪种芯片架构将成为人工智能时代的开路先锋

【IT168 评论】如果用刀来比喻芯片,通用处理器好比一把瑞士军刀,人工智能时代好比要拿刀来切肉,瑞士军刀可以拿来用,但它并非是为切肉设计的,所以效果并非最好。...

2116
来自专栏专知

【ACM MM2018】157页基于相似度的动作捕捉数据处理教程(附PPT下载)

【导读】本教程介绍了在3D人类运动捕捉领域中,基于相似度的数据处理方法当前所遇到的挑战以及最佳实践,包括sub sequence searching,动作识别或...

1682
来自专栏AI深度学习求索

深度学习如何入门?

大家好,这里是我的第一篇文章,我希望讲一讲深度学习如何入门,这是我研究生阶段师兄安排的入门方式,希望给大家带来帮助。首先,需要有一定的知识储备,如何储备相关知识...

1034
来自专栏机器人网

三个相关概念:深度学习Vs机器学习Vs模式识别

本文我们来关注下三个非常相关的概念(深度学习、机器学习和模式识别),最热门的科技主题(机器人和人工智能)的联系。

852
来自专栏PPV课数据科学社区

☞【PPT】数据挖掘方法及案例介绍

1、数据挖掘的引入 面对山一样高的,海一样广的数据,我们该怎么办? ? 数据挖掘中的5W问题 ❶为什么要使用数据挖掘? ❷数据挖掘是什么? ❸谁在使用数据挖掘?...

44512

扫码关注云+社区

领取腾讯云代金券