三更两点
微软歌声合成算法HIFISINGER论文解读
关注作者
前往小程序,Get
更优
阅读体验!
立即前往
腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
三更两点
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
社区首页
>
专栏
>
微软歌声合成算法HIFISINGER论文解读
微软歌声合成算法HIFISINGER论文解读
三更两点
关注
发布于 2021-01-26 14:45:20
312
0
发布于 2021-01-26 14:45:20
举报
文章被收录于专栏:
深度学习|机器学习|歌声合成|语音合成
文章目录
论文题目:
摘要
前沿
背景
方法
SF-gan来建模宽频率(频域)
ML-gan来建模长波形(时域)
其他设计
实验和结果
datasets
model config
训练和合成
音质对比
论文题目:
HIFISINGER: TOWARDS HIGH-FIDELITY NEURAL SINGING VOICE SYNTHESIS
摘要
高保真的歌声需要高的采样频率。高采样必定导致更宽的频率带和更长的波形序列,给歌声合成模型带来困难。
hifisinger是采用48kHZ的采样频率。它包括基于自然语音的fastSpeech和并行的声码器WaveGAN,在声学模型和声码器中引入了多尺度对抗训练,以改善歌唱建模。
sub-frequency GAN 来生成梅尔声谱图,并将80维的mel频率分成多
本文参与
腾讯云自媒体同步曝光计划
,分享自作者个人站点/博客。
原始发表:2021/01/19 ,如有侵权请联系
cloudcommunity@tencent.com
删除
前往查看
机器学习
神经网络
深度学习
人工智能
本文分享自
作者个人站点/博客
前往查看
如有侵权,请联系
cloudcommunity@tencent.com
删除。
本文参与
腾讯云自媒体同步曝光计划
,欢迎热爱写作的你一起参与!
机器学习
神经网络
深度学习
人工智能
评论
登录
后参与评论
0 条评论
热度
最新
推荐阅读
LV.
文章
0
获赞
0
目录
文章目录
论文题目:
摘要
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档
0
0
0
推荐