我们有一些原始的语音音频,需要在互联网上分发。我们需要像样的质量,但它不一定要有音乐质量。我们主要关心的是消费者的可用性(即他们可以在哪里播放什么内容)和下载的大小。我的经验表明,mp3s不能产生最好的语音音频压缩数,但我不知道最好的替代方案是什么。最终,我们希望自动转换过程,以允许消费者选择他们想要的质量与大小级别。
发布于 2008-10-03 16:04:44
Start here.
正如您正确地指出的,语音压缩不同于一般的音频压缩。您会发现许多专门用于电话应用的编解码器,从PCM和ADPCM到后来的基于分组的编码,如GSM蜂窝网络上使用的CELP。
尽管如此,由于使用的介质不同,VOIP语音编码与之略有不同。您可以在Speex software library中找到一个用于语音编码/解码的好的、免费的(无障碍的、开放源码的)库。
同样,您选择哪一个取决于您正在编码的语音和传输它的介质。还要注意的是,许多库都有几种算法,它们可以根据情况使用,有些甚至会根据声音和网络的条件即时切换。
要获得更多帮助,请缩小您的问题范围。
-Adam
发布于 2014-08-20 06:56:34
你应该试一试Opus。压缩命令行示例:
ffmpeg -i x.wav -b:a 32k x.opus发布于 2008-10-03 16:06:13
在实时语音音频(如VoIP电话)中使用的最常用的压缩格式是μ法律(在美国使用u法律/u法律)和a法律(在欧洲使用等)。与未压缩的PCM不同,它不支持较宽的频率范围(较小的可能值范围会忽略必要频谱之外的声音,并且需要较少的存储空间)。
出于可用性的考虑,使用mpeg压缩(mp2/3/4)来流式传输到标准媒体播放器是最容易的,因为算法很容易获得并且通常相当快,并且几乎所有的媒体播放器都应该支持它,但是对于语音,您可以尝试指定较低的比特率,或者首先从较低质量的文件进行转换(WAV可以有几个采样率,并且语音需要比音乐或效果低得多的采样率,它基本上就像视频中的每秒帧数)。或者,您可以使用Real Media、WMA或其他专有格式,但这将限制可用性,因为用户将需要特定的第三方软件来播放,尽管WMA具有出色的压缩比以及特定于语音音频的压缩选项。
https://stackoverflow.com/questions/167533
复制相似问题