深度学习理论与实战：提高篇

在线学习中心课程深度学习理论与实战：提高篇

5分钟

1.2 MFCC特征提取

MFCC特征提取步骤
上述步骤的作用
美尔尺度(Mel Scale)
详细实现过程
- 分帧
- 对每帧信号进行DFT
- 计算美尔滤波器组
- 能量取log
- DCT
计算梅尔滤波器组的参数
Deltas和Delta-Deltas特征
代码实现
Filter Bank特征 vs MFCC特征

语音识别的第一步是特征提取，也就是提取语音信号中有助于理解语言内容的部分而丢弃掉其它的东西（比如背景噪音和情绪等等）。

语音的产生过程如下：语音信号是通过肺部呼出气体，然后通过声门的开启与闭合产生的周期信号。再通过声道（包括舌头牙齿）对信号调制后产生。区分语音的关键就是声道的不同形状。不同的形状就对应不同的滤波器，从而产生了不同的语音。如果我们可以准确的知道声道的形状，那么我们就可以得到不同的音素(phoneme)的表示。声道的形状体现在语音信号短时功率谱的包络(envelope)中，因此好多特征提取方法需要准确的表示包络信息。

上一节: 1.1.4 语音识别效果评测下一节: 1.2.1 MFCC特征提取步骤

直播支持申请

目录

评价

推荐

1. 听觉

1.1 语音识别简介

1.1.2 任务分类

1.1.3 常见概念

1.1.4 语音识别效果评测

1.2 MFCC特征提取

1.2.1 MFCC特征提取步骤

1.2.2 上述步骤的作用

1.2.3 美尔尺度(Mel Scale)

1.2.4 详细实现过程

1.2.5 计算梅尔滤波器组的参数

1.2.6 Deltas和Delta-Deltas特征

1.2.7 代码实现

1.2.8 Filter Bank特征 vs MFCC特征

1.3 基于HMM的语音识别(一)

1.3.1 语音产生过程

1.3.2 听觉感知过程

1.3.3 信号处理

1.3.4 特征提取

1.3.5 HMM模型简介

a. 定义

b. 似然：前向算法(forward algorithm)

c. 解码：Viterbi算法

d. 学习：前向后向(forward-backward)算法

1.4 基于HMM的语音识别(二)

1.5 基于HMM的语音识别(三)

1.6 WFST简介

2. 视觉

章节内容更新中，敬请期待

3. 语言

章节内容更新中，敬请期待

4. 强化学习

章节内容更新中，敬请期待

5. 其它

章节内容更新中，敬请期待

李理

课程评价 (0)

学员评价

相关云产品

云服务器

GPU 云服务器

FPGA 云服务器_FPGA 实例_硬件加速

1.2 MFCC特征提取