我正在做一个需要将体育评论转换为文本的项目。为此,我已经使用了微软系统语音库。它在没有背景噪音的情况下运行良好。谁能告诉我一种方法,通过使用类似ffmpeg的工具或以其他编程方式从给定的音频文件中消除背景噪声。
发布于 2015-07-28 21:08:50
为了在这种情况下获得更好的准确性,最好使用更专业的解决方案,如CMUSphinx。
它可以帮助您做不同的事情:您可以配置解码器词汇表,以便它可以正确识别运动术语和表达
您可以充分利用噪声鲁棒性语音识别来处理背景噪声。外部噪声清理实际上对语音识别的准确性非常有害,因此不推荐使用。即使是像Vuvuzella denoising with Matlab这样的简单处理算法,也最好在解码器内部使用,而不是在处理之前。
https://stackoverflow.com/questions/31670540
复制相似问题