课程评价 (0)

请对课程作出评价:
0/300

学员评价

暂无精选评价
8分钟

1.1.2 任务分类

语音识别的任务可以根据如下的一些维度来分类:

  • 词汇量(vocabulary)大小 分为小词汇量(small vocabulary)和大词汇量(large vocabulary)的语音识别。
  • 说话人(Speaker) 分为说话人相关(Speaker dependent)和说话人无关(Speaker independent)语音识别系统。
  • 声学(Acoustic)环境 录音室 vs 不同程度的噪音环境。
  • 说话方式(style) 连续(continously)说话还是一个词一个词(isolated words)的说话;计划(plan)好的还是spontaneous的——”呃,这个东西,不,那个是啥?”

这些维度的组合就决定了不同任务的难度,比如最早的语音识别系统只能识别孤立词(词之间有停顿,因此很容易切分),而且词汇量很小(比如只能识别0-9之间的数字)。而现在的语音识别系统能够在噪声环境识别大词汇量的任务,而且说话人的方式是连续的,它可以处理不同说话人的差异甚至可以处理非标准的发音(比如带口音的普通话)。