课程评价 (0)

请对课程作出评价:
0/300

学员评价

暂无精选评价
5分钟

1.2 MFCC特征提取

目录

  • MFCC特征提取步骤
  • 上述步骤的作用
  • 美尔尺度(Mel Scale)
  • 详细实现过程
    • 分帧
    • 对每帧信号进行DFT
    • 计算美尔滤波器组
    • 能量取log
    • DCT
  • 计算梅尔滤波器组的参数
  • Deltas和Delta-Deltas特征
  • 代码实现
  • Filter Bank特征 vs MFCC特征

语音识别的第一步是特征提取,也就是提取语音信号中有助于理解语言内容的部分而丢弃掉其它的东西(比如背景噪音和情绪等等)。

语音的产生过程如下:语音信号是通过肺部呼出气体,然后通过声门的开启与闭合产生的周期信号。再通过声道(包括舌头牙齿)对信号调制后产生。区分语音的关键就是声道的不同形状。不同的形状就对应不同的滤波器,从而产生了不同的语音。如果我们可以准确的知道声道的形状,那么我们就可以得到不同的音素(phoneme)的表示。声道的形状体现在语音信号短时功率谱的包络(envelope)中,因此好多特征提取方法需要准确的表示包络信息。