我对用于Windows的语音识别软件感兴趣,它以一种标准格式(MP3、WAV、OGG等)获取播客的音频文件,并将语音的转录作为文本文件输出。其动机是帮助为官方wiki录制播客。
我希望它能够教它,提高语音识别,或学习新单词。此外,它应该能够处理多人交谈,偶尔重叠的讲话,偶尔的音乐,或非说话的声音。
我只需要这个软件来处理英语。
发布于 2014-04-14 00:23:55
龙自然语言 (非免费):
发布于 2014-04-14 10:17:53
如果您正在寻找开源软件并准备进行一些编码,请检查CMUSphinx。在Windows上,您可以运行Java版本。
http://cmusphinx.sourceforge.net/wiki/tutorialsphinx4
在将mp3文件传递给识别器之前,需要将它们转换为wav文件。您可以使用Java 三头龙或ffmpeg来完成它。
你可以使它适应你的领域和说话人,并从它获得良好的识别精度。
https://softwarerecs.stackexchange.com/questions/3198
复制相似问题