前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >谷歌用AI合成语音:真人难以辨别瑕疵

谷歌用AI合成语音:真人难以辨别瑕疵

作者头像
企鹅号小编
发布2018-01-15 10:59:11
8460
发布2018-01-15 10:59:11
举报
文章被收录于专栏:企鹅号快讯企鹅号快讯

【中关村在线新闻资讯】12月29日消息,谷歌本月推出了一款名为“Tacotron 2”的全新文字转语音系统,它具有惊人的发音准确性,且实际文本阅读效果几乎同真人声音无法区分。

谷歌用AI合成语音(图片来自baidu)

“Tacotron 2”其实已经是谷歌的第二代类似技术,它由两个深度神经网络组成。目前,该系统只进行了英语女声的训练(如要需要它发出男性声音的话,谷歌则需要对其进行重新“培训”)。

谷歌的研究人员表示,“Tacotron 2”完全可以准确发音一些非常复杂的单词和人名,并根据标点符号的不同而有所区分,甚至能够完美地讲完一段绕口令。举例来说,“Tacotron2”会默认在读到大写单词的时候加重语气,也能够处理少量的人为打字错误。

“Tacotron 2”上所谓“语音合成技术”又称文本转语音(TTS)是如今很多移动产品和应用上不可或缺的技术模块,例如语音交互应用、导航、语音控制以及为视力障碍者设计的产品中都需要语音合成技术的支持。在此之前很长一段时间内,语音合成技术都是采用拼接方式,需要记录大量语料才能进行语音合成。这样的方法不仅前期需要处理大量数据,而且一旦说话人有所改变就需要重新记录和处理,所以业界一直在寻找可以实时生成语音的方式。

本文来自企鹅号 - 人民网媒体

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文来自企鹅号 - 人民网媒体

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
语音合成
语音合成(Text To Speech,TTS)满足将文本转化成拟人化语音的需求,打通人机交互闭环。提供多场景、多语言的音色选择,支持 SSML 标记语言,支持自定义音量、语速等参数,让发音更专业、更符合场景需求。语音合成广泛适用于智能客服、有声阅读、新闻播报、人机交互等业务场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档