一个小小的背景:我面临着为一个新的PBX & IVR转换3000个IVR脚本。
目前,语音脚本以.VOX格式存在--而且.它们不是“写出来的”/文档。
我谦卑地问是否有人知道一个程序,这样,我就可以将.vox文件转储到程序中,让它生成一个文本文档。如果.vox格式是一个问题,我可能可以将它们全部转换为.wav或其他什么的。
是的,有大量的应用程序/程序可以实时地对文本进行语音处理,但我希望能够将录音“上传/转储”到程序中,并获取文本。
有人能给我指明正确的方向吗?
预先感谢您的任何评论/帮助。SF
发布于 2014-05-19 21:04:17
问题是,您希望对低质量的音频文件执行通用的自然语言处理。低质量的音频数据大大降低了自然语言处理软件的可靠性。更新您的音频文件将不会改善其内容,这意味着糟糕的结果,即使你有一个自然语言引擎。
你最好的选择是与一家公司合作,执行机器/人的混合转录,并支付他们的每一份转录。或者,您可以考虑与亚马逊机械土耳其公司合作,并购买一些通用的人类努力,以使这些转录。在这两种情况下,很可能VOX文件无法工作,您首先需要将它们转换为WAV或MP3文件,以便第三方更容易地使用现成的软件来听提示。
https://stackoverflow.com/questions/23745797
复制相似问题