首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >Windows语音识别软件,以音频文件为输入,输出文本文件

Windows语音识别软件,以音频文件为输入,输出文本文件
EN

Software Recommendation用户
提问于 2014-04-14 00:17:01
回答 2查看 4.9K关注 0票数 5

我对用于Windows的语音识别软件感兴趣,它以一种标准格式(MP3、WAV、OGG等)获取播客的音频文件,并将语音的转录作为文本文件输出。其动机是帮助为官方wiki录制播客。

我希望它能够教它,提高语音识别,或学习新单词。此外,它应该能够处理多人交谈,偶尔重叠的讲话,偶尔的音乐,或非说话的声音。

我只需要这个软件来处理英语。

EN

回答 2

Software Recommendation用户

发布于 2014-04-14 00:23:55

龙自然语言 (非免费):

  • 可以做声音转录,但只有在单一的声音(即不设计用于多个扬声器)和这个声音必须是你的,因为你需要事先训练龙。
  • 识别PC版本的.wav、.wma、.dss、ds2和.mp3文件( Mac版本的.wav、.m4a、.m4v、.mp4、.aif和.aiff音频文件格式)
  • 可以教生词,并接受训练以提高准确性。
票数 1
EN

Software Recommendation用户

发布于 2014-04-14 10:17:53

如果您正在寻找开源软件并准备进行一些编码,请检查CMUSphinx。在Windows上,您可以运行Java版本。

http://cmusphinx.sourceforge.net/wiki/tutorialsphinx4

在将mp3文件传递给识别器之前,需要将它们转换为wav文件。您可以使用Java 三头龙或ffmpeg来完成它。

你可以使它适应你的领域和说话人,并从它获得良好的识别精度。

票数 1
EN
页面原文内容由Software Recommendation提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://softwarerecs.stackexchange.com/questions/3198

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档