前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >关于语音识别你了解多少?

关于语音识别你了解多少?

作者头像
陌无崖
发布2019-10-12 13:50:39
1K0
发布2019-10-12 13:50:39
举报

不忘初心,砥砺前行

作者 | 陌无崖

转载请联系授权

语音识别有哪些功能

语音输入系统

1、提取有效的声音信息 2、从有效信息识别身份 3、声音信号转换成电信号

语音控制系统

通过语音信息与实际内容进行匹配

智能对话系统

智能理解用户的需求

实现过程

转化语音信号

1、语音预处理(语音信号采样、反混叠带通滤波、去除个体发音差异和设备、环境引起的噪声影响等) 2、声波------>电信号------>二进制 3、语音识别只能找到与说话者发音最为相似的字音。在判断相似性时 ,我们首先需要设定好标准读

比较两个向量之间的夹角大小 ,把特征分析提取的一组随时间而变的特征矢量序列和事先通过学习后存在机器里样本序列进行比较。我们将两个向量相乘再除以他们各自的模得到他们之间的夹角 ,夹角越小 ,向量之间也就越为相似 ,从而语音识别得以找到最接近每个人发音的字形。(模板匹配法、隐马尔夫法 (HMM) 和神经网络法 (ANN)

机器学习过程

1、训练 首先 ,我们人为的将不同的声波匹配成不同的特征向量 ,并将它们输入到语音识别内部的计算机内 ,这样语音识别就拥有了一个初步的词组库 ,随后以词组库为基础 ,建立一个能够分类这些词组的模型 2、学习 识别出的词组数据用来完善数据库

语音分析

分词断句(贝叶斯原理)

采样和量化

模拟信号———>采样———>量化———>数字信号 采样:离散的序列代表采样函数,将音频波形分成若干等分。 量化:量化采用数字化的方法来反映出声波电压值的大小。以bit为单位。在量化的过程中需要做好失真处理,一般我们使用提高采样频率和增加量化精度。

上下文表示

在识别过程中使帧与帧之间语音信号从模拟信号到数字信号转变是过渡平稳,且能够保持一种连续性。采用交叉识别重叠的方式进行分帧处理

端点检测

确定语音的开始和终止。(时域处理,频域分析)

本文参考文献 [1]詹新明,黄南山,杨灿.语音识别技术研究进展[J].现代计 算机(专业版) [2]《语音识别》——维基百科,自由百科的全书 [3]杨行峻, 迟惠生,“语音数字信号处理”, 电子工业出版社. 1995 [4]崔天宇 吉林大学硕士学位论文《基于HMM的语音识别系统的研究与实现 》 [5]陆昱方,科技传播第二期期刊《简述语音识别的实现过程》

最近在学习语音识别相关知识,这篇文章作语音识别的入门介绍。

END

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-10-05,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 golang技术杂文 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 语音识别有哪些功能
    • 语音输入系统
      • 语音控制系统
        • 智能对话系统
        • 实现过程
          • 转化语音信号
            • 机器学习过程
              • 语音分析
                • 采样和量化
                  • 上下文表示
                    • 端点检测
                    相关产品与服务
                    语音识别
                    腾讯云语音识别(Automatic Speech Recognition,ASR)是将语音转化成文字的PaaS产品,为企业提供精准而极具性价比的识别服务。被微信、王者荣耀、腾讯视频等大量业务使用,适用于录音质检、会议实时转写、语音输入法等多个场景。
                    领券
                    问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档