我需要转换从.WAV到ASCII码文本文件中使用我的脚本。FFMpeg可以从.wav转换为.raw:
ffmpeg -i input.wav -f s16le -acodec pcm_s16le output.raw
但我不能将.raw转换为.txt或.dat。我知道六进制转储,但我需要一些能在windows下工作的东西。
关于如何实现这个功能,或者从.wav转换到.txt的另一种方法,有什么建议吗?
发布于 2019-09-27 06:41:40
ffmpeg是一种工具,用于在各种压缩格式与原始音频和视频数据之间对音频和视频进行编码和解码,并封装或提取来自各种容器格式的各种流。它没有任何功能来解释数据的含义,例如识别音频中的单词或视频中的形状。(虽然您可能可以从视频中提取字幕文本)
翻译人类语音是一个“难题”,对于许多公司和大学来说,这仍然是一个活跃的研究课题。语言和方言(以及新词的不断演变)使这一点变得特别困难。
如果你想要一些免费的东西,你可以在脚本中运行,而不需要访问互联网服务,你需要看看像CMU Sphinx,Julius或Kaldi这样的软件
我尝试过Sphinx和Juluis,结果好坏参半。那是很久以前的事了,所以我建议尝试一下所有3个版本的最新版本,看看哪一个能为你正在处理的特定音频提供最好的性能。
https://stackoverflow.com/questions/58125459
复制相似问题