前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >谷歌正在研究能够让计算机合成语音更加自然的技术 | 黑科技

谷歌正在研究能够让计算机合成语音更加自然的技术 | 黑科技

作者头像
镁客网
发布2018-05-29 10:35:19
4610
发布2018-05-29 10:35:19
举报
文章被收录于专栏:镁客网

研究通过将人类语音片段嵌入计算机语音风格,来获得重音等效果。

3月28日,据国外媒体报道,谷歌研究院正在探索让机器合成语音更加自然的方法。谷歌大脑和机器感知团队的成员本周二在博客中公布了一些能让语音更具有表现力的方法示例。

同时,谷歌发布了“云端文本转语音”服务的测试版,提供了与谷歌助手同样的语音合成服务。该服务采用了DeepMind的WaveNet技术,这个技术可以被用于生成非常自然的声音。

有报道显示,谷歌研究员近期发表了两篇论文,提出了新的发音方法,介绍了如何模仿语音中的重音或语调。这两篇论文的技术都是基于Tacotron2。Tacotron2是谷歌去年12月份推出的人工智能系统,使用神经网络进行训练,模仿人类语音。

Tacotron在大部分情况下都可以模拟真人声音,但是却无法模仿说话中的重音和自然语调。Tacotron的联合发明人Wang Yuxuan参与了其中一篇论文研究。研究通过将人类语音片段嵌入计算机语音风格,使合成语音中实现了重音等效果。另一篇论文的研究则使用无监督训练和识别语音模式,并模仿某些语音风格。

在语音技术研发上,去年苹果Siri被众多消费者认为是更加具有表现力的声音。同时去年四月,亚马逊Alexa面向语音应用开发者提供了SSML标签,在语音助手中增加了更丰富的表达,例如停顿、轻语,以及一些感叹词等。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-03-29,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 镁客网 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
语音合成
语音合成(Text To Speech,TTS)满足将文本转化成拟人化语音的需求,打通人机交互闭环。提供多场景、多语言的音色选择,支持 SSML 标记语言,支持自定义音量、语速等参数,让发音更专业、更符合场景需求。语音合成广泛适用于智能客服、有声阅读、新闻播报、人机交互等业务场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档