前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >微软歌声合成算法HIFISINGER论文解读

微软歌声合成算法HIFISINGER论文解读

作者头像
三更两点
发布2021-01-26 14:45:20
3120
发布2021-01-26 14:45:20
举报

文章目录

  • 论文题目:
  • 摘要
  • 前沿
  • 背景
  • 方法
    • SF-gan来建模宽频率(频域)
    • ML-gan来建模长波形(时域)
    • 其他设计
  • 实验和结果
    • datasets
    • model config
    • 训练和合成
    • 音质对比

论文题目:

  • HIFISINGER: TOWARDS HIGH-FIDELITY NEURAL SINGING VOICE SYNTHESIS

摘要

  • 高保真的歌声需要高的采样频率。高采样必定导致更宽的频率带和更长的波形序列,给歌声合成模型带来困难。
  • hifisinger是采用48kHZ的采样频率。它包括基于自然语音的fastSpeech和并行的声码器WaveGAN,在声学模型和声码器中引入了多尺度对抗训练,以改善歌唱建模。
  • sub-frequency GAN 来生成梅尔声谱图,并将80维的mel频率分成多
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2021/01/19 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 文章目录
  • 论文题目:
  • 摘要
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档