今天测试了一个工具,大小只有1.1M,是用于命令行的一个软件。
balcon - 文字转语音,速度非常快,效果也不错。
文件体积如此之小,主要在于它调用了系统的TTS服务,自身并没有文本合成语音的能力。
在windows 7 平台下,使用 balcon -l 选项列举出系统支持的TTS引擎:
SAPI 5:
Microsoft Anna
Microsoft Lili
这两个语音是windows系统携带的,中英文均支持,但是与AI训练出来的语音合成,还是有不小差距的,机器感有点儿强,转折不够自然;并且,对于分词的理解和停顿,几乎是没有的。
微软可能对于英文语系下做过不少优化,英文的合成速度和效果,均属优秀。
因为是专注命令行的软件,没有提供GUI界面支持,但是却可充分利用管道符灵活操作。
比如有一个演讲文本 speech.txt,然后需要将该文本合成为语音,只要执行下面的命令
balcon -f speech.txt -w result.wav
片刻之间语音文件就生成了。
对于音色也有很多选项可供使用:
-n<VOICE_NAME>:设置语音。
-p<整数>:音高(从-10到10)。
-v<整数>:语音音量(从0到100)。
-e<整数>:句子之间暂停(单位为毫秒)。
-a<整数>:段落之间暂停(单位为毫秒)。
-fr<整数>:输出音频采样频率,单位为kHz(8~48)。
-bt<整数>:输出音频位深度(8或16)。
-ch<整数>:输出音频通道模式(1或2)。
需要对合成语音做调整的可以使用以上参数测试。
最后,这个balcon是不是很强大?
啥?壳?
这个balcon是不是很强大的壳?:-)