在短时分析中,将语音信号分为一段一段的语音帧,每一帧一般取10-30ms,我们的研究就建立在每一帧的语音特征分析上。...winlen=0.025, winstep=0.01, nfilt=26, nfft=512, lowfreq=0, highfreq=None, preemph=0.97, winfunc=>)
从一个音频信号中计算梅尔滤波器能量特征...第一个是一个包含着特征的大小为nfilt的numpy数组,每一行都有一个特征向量。第二个返回值是每一帧的能量。...samplerate=16000, winlen=0.025, winstep=0.01, nfilt=26, nfft=512, lowfreq=0, highfreq=None, preemph=0.97)
从一个音频信号中计算梅尔滤波器能量特征的对数...,返回: 一个包含特征的大小为nfilt的numpy数组,每一行都有一个特征向量
参数
参数:
signal - 需要用来计算特征的音频信号,应该是一个N*1的数组
samplerate - 我们用来工作的信号的采样率