开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

DeepMind AI加持，谷歌推出文本转语音合成服务

文章来源：企鹅号 - 驱动中国网络传媒

驱动中国2018年3月29日消息据外媒报道，谷歌公司近期正推出一款新的AI语音合成器，用于其机器学习云工具套件。这款语音合成器是一项名为云文本到语音的服务（Cloud Text-to-Speech），并由谷歌位于英国的AI子公司DeepMind通过WaveNet提供技术支持。

据悉，此次谷歌推出的AI语音合成器，在WaveNet的支持下借助机器学习从头开始生成音频，通过分析人类语音数据库中的波形，并以每秒24,000个样本的速率重新创建这些波形，包括唇音和口音等微妙的声音。

相较而言，目前包括苹果Siri的大多数语音合成器使用了所谓的连接合成技术，即通过其中程序存储单个音节 - 诸如“ba”，“sht”和“oo”的声音 - 并且将它们一起飞起来形成单词和句子。这种几年前在成熟应用的技术，在现在听起来仍然很尴尬。

在谷歌于2014年收购DeepMind之后，这家公司就在探索将AI技术变为有形产品。借助DeepMind AI技术，谷歌数据中心的电力成本降低40%，并将WaveNet直接整合到其云服务中。谷歌表示，DeepMind的AI语音合成技术是业内最先进和最现实的技术之一。

在去年10月份，WaveNet就被整合到Google Assistant中。现在基于Cloud Text-To-Speech，可用于语言的精选。谷歌称，这项新服务提供32种不同的语音，可以说12种语言，用户可以自定义音调和速度等因素

发表于: 2018-03-292018-03-29 13:24:41
原文链接：http://kuaibao.qq.com/s/20180329A0R4IG00?refer=cp_1026
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群