首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >Android音频FFT显示基频

Android音频FFT显示基频
EN

Stack Overflow用户
提问于 2011-11-30 11:31:55
回答 3查看 9.8K关注 0票数 4

我在一个Android项目上工作了一段时间,这个项目显示输入信号的基本频率(作为调谐器)。我已经成功地实现了AudioRecord类,并且正在从中获取数据。但是,我很难对这些数据执行FFT来获得输入信号的基频。我一直在查看post 这里,并且正在使用Java中的FFT复类来支持它。

我已经成功地使用了在Java中FFT中找到的FFT函数,但我不确定我是否获得了正确的结果。对于快速傅立叶变换(sqrtre_re+im_im)的幅度,我得到的数值开始很高,大约15000赫兹,然后慢慢减小到大约300赫兹。似乎不对。

此外,就麦克风的原始数据而言,数据似乎很好,只是前50个左右的值总是数字3,除非我在应用程序中再次按调优按钮,然后只得到大约15个。这正常吗?

这是我的代码。

首先,我使用来自我一直在看的帖子的以下代码将短数据(从麦克风获得)转换为双倍数据。我并不完全理解这段代码,但我认为它是有效的。

代码语言:javascript
代码运行次数:0
运行
复制
//Conversion from short to double
double[] micBufferData = new double[bufferSizeInBytes];//size may need to change
final int bytesPerSample = 2; // As it is 16bit PCM
final double amplification = 1.0; // choose a number as you like
for (int index = 0, floatIndex = 0; index < bufferSizeInBytes - bytesPerSample + 1; index += bytesPerSample, floatIndex++) {
    double sample = 0;
    for (int b = 0; b < bytesPerSample; b++) {
        int v = audioData[index + b];
        if (b < bytesPerSample - 1 || bytesPerSample == 1) {
            v &= 0xFF;
        }
        sample += v << (b * 8);
    }
    double sample32 = amplification * (sample / 32768.0);
    micBufferData[floatIndex] = sample32;
}

然后,守则继续如下:

代码语言:javascript
代码运行次数:0
运行
复制
//Create Complex array for use in FFT
Complex[] fftTempArray = new Complex[bufferSizeInBytes];
for (int i=0; i<bufferSizeInBytes; i++)
{
    fftTempArray[i] = new Complex(micBufferData[i], 0);
}

//Obtain array of FFT data
final Complex[] fftArray = FFT.fft(fftTempArray);
final Complex[] fftInverse = FFT.ifft(fftTempArray);

//Create an array of magnitude of fftArray
double[] magnitude = new double[fftArray.length];
for (int i=0; i<fftArray.length; i++){
    magnitude[i]= fftArray[i].abs();
}


fft.setTextColor(Color.GREEN);
fft.setText("fftArray is "+ fftArray[500] +" and fftTempArray is "+fftTempArray[500] + " and fftInverse is "+fftInverse[500]+" and audioData is "+audioData[500]+ " and magnitude is "+ magnitude[1] + ", "+magnitude[500]+", "+magnitude[1000]+" Good job!");
for(int i = 2; i < samples; i++){
    fft.append(" " + magnitude[i] + " Hz");
}

最后一点就是检查我得到了什么值(并让我保持理智!)在上面提到的帖子中,它谈到了需要采样频率,并给出了以下代码:

代码语言:javascript
代码运行次数:0
运行
复制
private double ComputeFrequency(int arrayIndex) {
    return ((1.0 * sampleRate) / (1.0 * fftOutWindowSize)) * arrayIndex;
}

如何实现此代码?我真的不明白fftOutWindowSize和arrayIndex是从哪里来的?

任何帮助都是非常感谢的!

达斯汀

EN

回答 3

Stack Overflow用户

发布于 2013-01-23 09:51:03

最近,我正在做一个要求几乎相同的项目。也许你不再需要任何帮助了,但我还是会给出我的想法的。也许将来有人需要这个。

  1. 我不确定短函数和双函数是否有效,我也不明白这段代码。它是为字节到双转换而写的。
  2. 在代码:"double[] micBufferData = new double[bufferSizeInBytes];"中,我认为micBufferData的大小应该是"bufferSizeInBytes / 2",因为每个示例都需要两个字节,而micBufferData的大小应该是示例号。
  3. FFT算法确实需要一个FFT窗口大小,它必须是一个2次方的数字。然而,许多算法都可以接收任意的数字作为输入,其余的算法都可以。在这些算法的文档中应该有输入的要求。在这种情况下,复杂数组的大小可以作为FFT算法的输入。我不太清楚FFT算法的细节,但我认为不需要逆算法。
  4. 要使用您最后给出的代码,首先应该在示例数组中找到峰值索引。我使用双数组作为输入,而不是复杂的输入,所以在我的例子中,它类似于:double maxVal = -1;int maxIndex = -1; 对于( int j=0;j< mFftSize / 2;++j ){ double v=fftResult2 2*j* fftResult2*j + fftResult2*j+1 * fftResult2*j+1;if( v> maxVal ){ maxVal = v;maxIndex = j;}} 2*j是实部,2*j+1是虚部。maxIndex是您想要的峰值大小的索引(更详细的这里),并将其用作ComputeFrequency函数的输入。返回值是所需示例数组的频率。

希望能帮上忙。

票数 3
EN

Stack Overflow用户

发布于 2011-11-30 15:59:01

您应该根据时间和频率分辨率的要求选择FFT窗口大小,而不仅仅是在创建FFT临时数组时使用音频缓冲区大小。

数组索引是您的int i,正如您在量值打印语句中使用的那样。

music的基音频率通常不同于FFT峰值幅值,因此您可能需要研究一些基音估计算法。

票数 2
EN

Stack Overflow用户

发布于 2013-01-23 10:17:26

我怀疑你得到的奇怪结果是因为你可能需要解压FFT。如何做到这一点将取决于您正在使用的库(例如,有关文档如何在GSL中打包,请参见这里 )。包装可能意味着真实和想象的组件不在数组中您所期望的位置上。

对于关于窗口大小和分辨率的其他问题,如果您正在创建一个调谐器,那么我建议尝试一个大约20 at的窗口大小(例如,44.1kHz的1024个示例)。对于一个调谐器,你需要相当高的分辨率,所以你可以尝试零填充8或16倍,这将给你一个3-6赫兹的分辨率。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/8325241

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档