DeepMind AI加持,谷歌推出文本转语音合成服务

驱动中国2018年3月29日消息 据外媒报道,谷歌公司近期正推出一款新的AI语音合成器,用于其机器学习云工具套件。这款语音合成器是一项名为云文本到语音的服务(Cloud Text-to-Speech) ,并由谷歌位于英国的AI子公司DeepMind通过WaveNet提供技术支持。

据悉,此次谷歌推出的AI语音合成器,在WaveNet的支持下借助机器学习从头开始生成音频,通过分析人类语音数据库中的波形,并以每秒24,000个样本的速率重新创建这些波形,包括唇音和口音等微妙的声音。

相较而言,目前包括苹果Siri的大多数语音合成器使用了所谓的连接合成技术,即通过其中程序存储单个音节 - 诸如“ba”,“sht”和“oo”的声音 - 并且将它们一起飞起来形成单词和句子。这种几年前在成熟应用的技术,在现在听起来仍然很尴尬。

在谷歌于2014年收购DeepMind之后,这家公司就在探索将AI技术变为有形产品。借助DeepMind AI技术,谷歌数据中心的电力成本降低40%,并将WaveNet直接整合到其云服务中。谷歌表示,DeepMind的AI语音合成技术是业内最先进和最现实的技术之一。

在去年10月份,WaveNet就被整合到Google Assistant中。现在基于Cloud Text-To-Speech,可用于语言的精选。谷歌称,这项新服务提供32种不同的语音,可以说12种语言,用户可以自定义音调和速度等因素

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180329A0R4IG00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码关注腾讯云开发者

领取腾讯云代金券