基于傅里叶变换的音频重采样算法 (附完整c代码)

前面有提到音频采样算法:

WebRTC 音频采样算法 附完整C++示例代码

简洁明了的插值音频重采样算法例子 (附完整C代码)

近段时间有不少朋友给我写过邮件,说了一些他们使用的情况和问题。

坦白讲,我精力有限,但一般都会抽空回复一下。

大多数情况,阅读一下代码就能解决的问题,

也是要尝试一下的。

没准,你就解决了呢?

WebRtc的采样算法本身就考虑到它的自身应用场景,

所以它会有一些局限性,例如不支持任意采样率等等。

而简洁插值的这个算法,

我个人也一直在使用,因为简洁明了,简单粗暴。

我自然也就没有进一步去细究采样算法,

当然网上还有不少开源的采样算法也是极其不错的。

一直也想抽时间再做一个兼顾简洁和质量的算法出来,不了了之。

最近一直在死磕傅里叶变换,网上的资源看了一箩筐。

徘徊到最后,毫无疑问FFTW3必须是你的首选,

从岁数性能以及使用的概率来说,当之无愧的王者。

当然也顺带整理一下,其他的一些FFT实现,各有优劣。

用于学习,作为参考资料也是不二之选。

有兴趣的小伙伴,可以参阅之.

https://github.com/cpuimage/StockhamFFT

https://github.com/cpuimage/uFFT

https://github.com/cpuimage/BluesteinCrz

https://github.com/cpuimage/fftw3

当然最佳的参考资料,还是fftw3,

我的这个git做了以下工作:

1.梳理调整目录结构

2.移除一些影响阅读调试,让人头大的宏定义

3.合并代码至fftw_api.c,移除一些不常用的代码

注意:未经过严格测试验证

也许这个git存在的意义在于方便众人阅读学习fftw的算法思路,

以及调试,扣代码等等诸如此类的行为。

所以有需要的同学可以,参考之。

回到本次的主题,

在以前做图像算法的时候,就一直在想一个问题,

是否可以利用傅里叶变换的特性进行图像的重采样呢?

这个一直是我心中的一个小石头,一直没放下。

从理论上来说,可行的,只是估计最终质量并不能保证。

最佳的尝试莫过于音频重采样,在很多时候,

我们经常需要对一个音频进行傅里叶变换,然后进行上采样或下采样的操作。

那是不是可以直接就在频域进行重采样呢?

这样的做法是不是质量就能有所保障呢?

事实证明,这是可行的。

经过简单试验,基于傅里叶变换的音频重采样算法就这样出炉了。

目前示例采用hsfft 这个开源傅里叶变换进行验证,

没有采用fftw3的原因也很简单,因为fftw3编译器来有点麻烦。

而hsfft的函数风格与fftw3类似,只是速度性能上不及fftw3而已。

这样也符合我的要求,真正应用的时候再使用fftw3替换之即可,

在验证思路的时候,没必要动用fftw3,

这也是我为什么使用简洁重采样的原因之一。

每个步骤都要有策略和方法,不必太过较真。

如果特定情况下需要,我也可以上matlab,python,delphi,c#,c++等等。

语言只是工具,关键还是思路和思想。

贴上主要代码:

#ifndef MIN
#define MIN(a, b) ((a) < (b) ? (a) : (b))
#endif 

void FFTResample(float *input, float *output, int sizeIn, int sizeOut) {
    fft_t *fftin = (fft_t *) calloc(sizeof(fft_t), sizeIn);
    fft_t *fftout = (fft_t *) calloc(sizeof(fft_t), sizeOut);
    if (fftin == NULL || fftout == NULL) {
        if (fftout)
            free(fftout);
        if (fftin)
            free(fftin);
        return;
    }
    fft_real_object fftPlan = fft_real_init(sizeIn, 1);
    fft_r2c_exec(fftPlan, input, fftin);
    free_real_fft(fftPlan);
    int halfIn = (sizeIn / 2) + 1;
    int halfOut = (sizeOut / 2) + 1;
    for (int i = 0; i < MIN(halfIn, halfOut); ++i) {
        fftout[i].re = fftin[i].re;
        fftout[i].im = fftin[i].im;
    }
    fft_real_object ifftPlan = fft_real_init(sizeOut, -1);
    fft_c2r_exec(ifftPlan, fftout, output);
    free_real_fft(ifftPlan);
    float norm = 1.f / sizeIn;
    for (int i = 0; i < sizeOut; ++i) {
        output[i] = (output[i] * norm);
    }
    free(fftout);
    free(fftin);
}

算法非常简单,用一句时髦的语言来描述这个算法,就是“多退少补“。

需要补课FFT的可以移步:

从多项式乘法到快速傅里叶变换

项目地址:

https://github.com/cpuimage/fftResample

采用Cmake编译即可,示例代码也很简洁。

不多做解释了~

以上,权当抛砖引玉。

若有其他相关问题或者需求也可以邮件联系俺探讨。

邮箱地址是:  gaozhihan@vip.qq.com

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

编辑于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏PPV课数据科学社区

【学习】如何用SPSS和Clementine处理缺失值、离群值、极值?

一、什么是预处理、预分析? 高质量数据是数据分析的前提和分析结论可靠性的保障。尽管在获取数据源时数据分析师格外谨慎,耗费大量的时间,但数据质量仍然需持续关注。不...

8455
来自专栏大数据挖掘DT机器学习

时间序列预测全攻略(附带Python代码)

原文作者:AARSHAY JAIN 36大数据翻译,http://www.36dsj.com/archives/43811 时间序列(简称TS)被认为是分...

1.8K7
来自专栏Python小屋

Python计算电场中两点间的电势差

根据组合数定义,需要计算3个数的阶乘,在很多编程语言中都很难直接使用整型变量表示大数的阶乘结果,虽然Python并不存在这个问题,但是计算大数的阶乘仍需要相当多...

811
来自专栏小石不识月

用粒子群优化算法求解旅行商问题

粒子群优化算法采用一种人工智能的形式来解决问题。这种算法对于求解那些使用了多个连续变化的值的函数来说,尤为有效。这篇文章将会介绍如何修改粒子群算法,以使用离散固...

4078
来自专栏数据科学与人工智能

【机器学习】Python语言下的机器学习库

Python是最好的编程语言之一,在科学计算中用途广泛:计算机视觉、人工智能、数学、天文等。它同样适用于机器学习也是意料之中的事。 当然,它也有些缺点;其中一个...

25610
来自专栏iOSDevLog

Scikit-Learn教程:棒球分析 (一)

一个scikit-learn教程,通过将数据建模到KMeans聚类模型和线性回归模型来预测MLB每赛季的胜利。

1772
来自专栏一心无二用,本人只专注于基础图像算法的实现与优化。

13行代码实现最快速最高效的积分图像算法。

  研究图像到一定程度的人,应该都对积分图像有所了解,大家在百度或者google中都可以搜索到大量的相关博客,我这里不做多介绍。用积分图也确实能解决很多实际的问...

4078
来自专栏机器人网

Python最有用的机器学习工具和库

Python是最好的编程语言之一,在科学计算中用途广泛:计算机视觉、人工智能、数学、天文等。它同样适用于机器学习也是意料之中的事。

1295
来自专栏恰同学骚年

Unity3D游戏开发初探—2.初步了解3D模型基础

  简而言之,3D模型就是三维的、立体的模型,D是英文Dimensions的缩写。

1003
来自专栏AI研习社

PyTorch 特辑!网红 5 分钟带你入门 PyTorch

Siraj Raval 作为深度学习领域的自媒体人在欧美可以说是无人不知、无人不晓。 凭借在 Youtube 上的指导视频,Siraj Raval 在全世界吸...

44210

扫码关注云+社区