前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >战斗民族最强大的壳:TTS语音合成必杀技,俄罗斯造的这款你没用过

战斗民族最强大的壳:TTS语音合成必杀技,俄罗斯造的这款你没用过

作者头像
程序员小助手
发布2020-04-08 14:58:36
3790
发布2020-04-08 14:58:36
举报
文章被收录于专栏:程序员小助手程序员小助手

今天测试了一个工具,大小只有1.1M,是用于命令行的一个软件。

balcon - 文字转语音,速度非常快,效果也不错。

文件体积如此之小,主要在于它调用了系统的TTS服务,自身并没有文本合成语音的能力。

在windows 7 平台下,使用 balcon -l 选项列举出系统支持的TTS引擎:

SAPI 5:

Microsoft Anna

Microsoft Lili

这两个语音是windows系统携带的,中英文均支持,但是与AI训练出来的语音合成,还是有不小差距的,机器感有点儿强,转折不够自然;并且,对于分词的理解和停顿,几乎是没有的。

微软可能对于英文语系下做过不少优化,英文的合成速度和效果,均属优秀。

因为是专注命令行的软件,没有提供GUI界面支持,但是却可充分利用管道符灵活操作。

比如有一个演讲文本 speech.txt,然后需要将该文本合成为语音,只要执行下面的命令

balcon -f speech.txt -w result.wav

片刻之间语音文件就生成了。

对于音色也有很多选项可供使用:

-n<VOICE_NAME>:设置语音。

-p<整数>:音高(从-10到10)。

-v<整数>:语音音量(从0到100)。

-e<整数>:句子之间暂停(单位为毫秒)。

-a<整数>:段落之间暂停(单位为毫秒)。

-fr<整数>:输出音频采样频率,单位为kHz(8~48)。

-bt<整数>:输出音频位深度(8或16)。

-ch<整数>:输出音频通道模式(1或2)。

需要对合成语音做调整的可以使用以上参数测试。

最后,这个balcon是不是很强大?

啥?壳?

这个balcon是不是很强大的壳?:-)

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-04-01,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 程序员小助手 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
语音合成
语音合成(Text To Speech,TTS)满足将文本转化成拟人化语音的需求,打通人机交互闭环。提供多场景、多语言的音色选择,支持 SSML 标记语言,支持自定义音量、语速等参数,让发音更专业、更符合场景需求。语音合成广泛适用于智能客服、有声阅读、新闻播报、人机交互等业务场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档