前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >语音合成(speech synthesis)两种方法-拼接合成和参数合成

语音合成(speech synthesis)两种方法-拼接合成和参数合成

作者头像
全栈程序员站长
发布2022-09-13 15:08:23
1.2K0
发布2022-09-13 15:08:23
举报

大家好,又见面了,我是你们的朋友全栈君。

TTS(Text To Speech)是一个序列到序列的匹配问题。处理TTS的方法一般分为两部分:文本分析和语音合成(speech synthesis)。文本分析可能采用NLP方法。

而在语音合成(speech synthesis)上有两种主要的方法:一种是非参数化的,基于样例的方法,如拼接语音合成;另一种是参数化的、基于模型的方法,如统计参数语音合成。

拼接语音合成:

基于统计规则的大语料库拼接语音合成系统

超大规模音库制作:语料设计;音库录制;精细切分;韵律标注;

在这里插入图片描述
在这里插入图片描述

优点:音质最佳,录音和合成音质差异小,正常句子的自然度也好

缺点:非常依赖音库的规模大小和制作质量,尺寸大,无法在嵌入式设备中应用,仍然存在拼接不连续性

参数语音合成

对于引得频谱特性参数进行建模,生成参数合成器,来构建文本序列映射到语音的映射关系

在这里插入图片描述
在这里插入图片描述

优点:尺寸小,语音自然度好

缺点:音质不如拼接合成

发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/153162.html原文链接:https://javaforall.cn

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 拼接语音合成:
  • 参数语音合成
相关产品与服务
语音合成
语音合成(Text To Speech,TTS)满足将文本转化成拟人化语音的需求,打通人机交互闭环。提供多场景、多语言的音色选择,支持 SSML 标记语言,支持自定义音量、语速等参数,让发音更专业、更符合场景需求。语音合成广泛适用于智能客服、有声阅读、新闻播报、人机交互等业务场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档