前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >语音识别技术发展迅速,这本书是你需要的全方位解读语音识别的最新著作!

语音识别技术发展迅速,这本书是你需要的全方位解读语音识别的最新著作!

作者头像
博文视点Broadview
发布2020-07-16 10:34:59
6590
发布2020-07-16 10:34:59
举报
文章被收录于专栏:博文视点Broadview

随着物联网技术和智能设备技术的快速发展,人与机器的交互,不再仅依赖于鼠标和键盘,更有可能的是直接采用语音。

这其中的关键技术就是自动语音识别(Automatic Speech Recognition,ASR)。其所要完成的工作,简单地说,就是在与机器进行语音交流时,能够让机器听懂你在说什么。

自20世纪50年代以来,对语音识别的研究已有近70年的历史,取得了多方面的突破,如今已在产业界有较多的应用,如语音输入法、语音搜索、智能音箱等软硬件产品。这些产业应用带动了更多的企业和科研机构参与进来,因此需要了解和掌握语音识别技术的学生和工程师也越来越多,这时很需要一本合适的教材和参考书。

到目前为止,已出版的书籍介绍的知识各有侧重,对语音产业界起到了很大的推动作用,在此深表敬意。

但语音识别技术的发展日新月异,新的理论和方案不断出现,读者除了掌握基本原理,也亟须了解语音识别最新的前沿技术,例如加权有限状态转换器(WFST)、端到端(E2E)语音识别等。

全方位解读语音识别的最新著作来了!

《语音识别:原理与应用(全彩)》

洪青阳 李琳 著

本书内容来自作者多年积累总结,第一手教学资料,第一线研发经验;

既有语音采集、声学特征介绍,又有声学模型和语言模型讲解,循序渐进,图文并茂,深入浅出;

系统介绍经典算法、前沿技术和应用实践,涵盖语音识别全貌,包括GMM-HMM、DNN-HMM和E2E框架,以及WFST和LF-MMI等关键技术。

为帮助读者动手操作, 提高实战技能,本书最后还结合Kaldi和Espnet等开源工具,介绍了具体的工程实践方法。同时也详细介绍了诸如 Kaldi工具的使用和封装、云服务等开发实践,因此本书对于那些希望将理论转换成实际投产系统的研发人员极具实用性。

本书理论指导和工程实践并重,适合用作高校教材和技术人员手册。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-07-14,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 博文视点Broadview 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
语音识别
腾讯云语音识别(Automatic Speech Recognition,ASR)是将语音转化成文字的PaaS产品,为企业提供精准而极具性价比的识别服务。被微信、王者荣耀、腾讯视频等大量业务使用,适用于录音质检、会议实时转写、语音输入法等多个场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档