首页
学习
活动
专区
工具
TVP
发布

基于深度神经网络的语音合成

语音合成通常有以下几种方法:

谷歌WaveNet:主要思想如下,语音地波形就是各个采样点,每个采样点都受先前若干采样点地影响,存在条件概率密度函数,波形地联合概率可用条件概率分布地乘积来建模。

WaveNet将条件概率分布用多层卷积层建模,输出层不是普通意义上采样地语音波形,而是采用μ-律压缩后地结果。训练地细节包括用残差反馈进行区分性训练,以及采用skip connections,跳跃某些时序特征地约束,增多训练层数,最后采用Conditional WaveNet激活函数将信息综合起来训练。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181031A178KQ00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券