三更两点
基于CNN的歌声合成算法论文解读
关注作者
前往小程序,Get
更优
阅读体验!
立即前往
腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
三更两点
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
社区首页
>
专栏
>
基于CNN的歌声合成算法论文解读
基于CNN的歌声合成算法论文解读
三更两点
关注
发布于 2021-01-26 14:45:57
419
0
发布于 2021-01-26 14:45:57
举报
文章被收录于专栏:
深度学习|机器学习|歌声合成|语音合成
深度学习|机器学习|歌声合成|语音合成
文章目录
资料
前沿
基于DNN的歌声合成
基于CNN的歌声合成
损失函数
样本
结论
资料
https://n3utrino.work/
前沿
Title:Singing voice synthesis based on convolutional neural networks
核心思路:midi 输入到CNN,预测声学特征(acoustic feature),声学特征输入到声码器得到音频。
一句话:运用CNN模型将乐谱序列映射到声学特征
深度神经网络是人工神经网络,其包含很多隐含层。给语音合成和歌声合成带来机遇。其次在DNN的歌声合成方法中,DNN作为声学模型,就是实验从乐谱特征到声学特征的映射。
神经网络还可以对波形直接建模,例如wavenet、SampleRNN、WaveRNN、FFTnet、WaveGlow。神经王座作为声码器改变了语音合成的质量。神经网络声码器以声学特征作为输入。歌声合成最关键的是利用乐谱信息来预测声学特征。
前馈神经网络的局限是无法考虑到语音的序列特性。语音的每帧之间有相关性,但是前馈网络是认为各个帧是相互
本文参与
腾讯云自媒体分享计划
,分享自作者个人站点/博客。
原始发表:2021-01-21 ,如有侵权请联系
cloudcommunity@tencent.com
删除
前往查看
神经网络
机器学习
深度学习
人工智能
编程算法
本文分享自
作者个人站点/博客
前往查看
如有侵权,请联系
cloudcommunity@tencent.com
删除。
本文参与
腾讯云自媒体分享计划
,欢迎热爱写作的你一起参与!
神经网络
机器学习
深度学习
人工智能
编程算法
评论
登录
后参与评论
0 条评论
热度
最新
推荐阅读
LV.
关注
文章
0
获赞
0
目录
文章目录
资料
前沿
相关产品与服务
语音合成
语音合成(Text To Speech,TTS)满足将文本转化成拟人化语音的需求,打通人机交互闭环。提供多场景、多语言的音色选择,支持 SSML 标记语言,支持自定义音量、语速等参数,让发音更专业、更符合场景需求。语音合成广泛适用于智能客服、有声阅读、新闻播报、人机交互等业务场景。
产品介绍
产品文档
录音文件识别、一句话识别等多款语音产品新用户14.9元起
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档
0
0
0
推荐