深度学习理论与实战：提高篇

在线学习中心课程深度学习理论与实战：提高篇

8分钟

1.1.2 任务分类

语音识别的任务可以根据如下的一些维度来分类：

词汇量(vocabulary)大小分为小词汇量(small vocabulary)和大词汇量(large vocabulary)的语音识别。
说话人(Speaker) 分为说话人相关(Speaker dependent)和说话人无关(Speaker independent)语音识别系统。
声学(Acoustic)环境录音室 vs 不同程度的噪音环境。
说话方式(style) 连续(continously)说话还是一个词一个词(isolated words)的说话；计划(plan)好的还是spontaneous的——”呃，这个东西，不，那个是啥？”

这些维度的组合就决定了不同任务的难度，比如最早的语音识别系统只能识别孤立词(词之间有停顿，因此很容易切分)，而且词汇量很小(比如只能识别0-9之间的数字)。而现在的语音识别系统能够在噪声环境识别大词汇量的任务，而且说话人的方式是连续的，它可以处理不同说话人的差异甚至可以处理非标准的发音(比如带口音的普通话)。

上一节: 1.1 语音识别简介下一节: 1.1.3 常见概念

直播支持申请

目录

评价

推荐

1. 听觉

1.1 语音识别简介

1.1.2 任务分类

1.1.3 常见概念

1.1.4 语音识别效果评测

1.2 MFCC特征提取

1.2.1 MFCC特征提取步骤

1.2.2 上述步骤的作用

1.2.3 美尔尺度(Mel Scale)

1.2.4 详细实现过程

1.2.5 计算梅尔滤波器组的参数

1.2.6 Deltas和Delta-Deltas特征

1.2.7 代码实现

1.2.8 Filter Bank特征 vs MFCC特征

1.3 基于HMM的语音识别(一)

1.3.1 语音产生过程

1.3.2 听觉感知过程

1.3.3 信号处理

1.3.4 特征提取

1.3.5 HMM模型简介

a. 定义

b. 似然：前向算法(forward algorithm)

c. 解码：Viterbi算法

d. 学习：前向后向(forward-backward)算法

1.4 基于HMM的语音识别(二)

1.5 基于HMM的语音识别(三)

1.6 WFST简介

2. 视觉

章节内容更新中，敬请期待

3. 语言

章节内容更新中，敬请期待

4. 强化学习

章节内容更新中，敬请期待

5. 其它

章节内容更新中，敬请期待

李理

课程评价 (0)

学员评价

相关云产品

云服务器

GPU 云服务器

FPGA 云服务器_FPGA 实例_硬件加速

1.1.2 任务分类