语音识别基础(一)

labview语音识别基础

(预处理部分)

labview软件自带了声音采集功能,本节课利用【声音采集】功能来学习语音识别【预处理】部分,通过讲解我们会进一步熟练对信号的操作,接下来开始布置这节课的任务:

采集语音,提取出有效声音数据片段;

对声音片段进行频率和幅值分析;

实现单一频率纯度分析;

语音识别思维导图

1.将语音模板录入数据库;

2.采集样本,数据库声音比对;

3.根据比对结果,选择执行动作操作;

1.声音信号采集和预处理代码

1:因为启动采集需要时间,所以裁剪去掉信号的前1秒部分;

2:动态信号 [添加] [时间标识],转变为波形信号,然后 [归一化] 处理;

3:对信号进行 [二极管与电容] 处理,将波形轮廓信号;

4:对信号进行 [三极管] 处理,得到红色方波信号;

2.声音数据边沿分析代码

1:因为声音信号数据量大,进行50倍 [采样压缩] ,为 [寻找] [上升下降沿] 时间标识做准备;

2:产生 [上升沿模板] 和 [下降沿模板] ;

3: [全文搜索] 上升沿,得到引索位置,全文搜索下降沿,得到引索位置,合并为二位数组;

4,: [引索位置] 数据,转换为 [时间位置] 数据;

3.有效声音数据剪切代码

1:通过for循环,自动对数据进行 [行解析] ;

2:脉冲起始和结束时间,计算 [长度] ;

3:对 [原始信号] 进行分段剪切;

录制一段几秒的音频, [去掉首尾] 静音部分,检测出基本频率和平均声音强度;将音频剪切成 [很多音频段] ,逐个分析每一小段的 [基础频率] 和 [强度] ,得到两个一维数组,将频率数组设为纵坐标,将强度数组做为横坐标,得到很直观的频率幅度XY分布图。

叙述和原理很简单,核心是[剪掉静音]的方法和[剪切成n个小段]的方法,接下来开始学习相关内容:

4.声音片段分析代码

(下一节讲解)

5.数据数组整体分析

(下一节讲解)

6.声音识别整体流程框架

[带*号三角] 随机采集一个人的语音信息;

[绿色菱形] 声音特征匹配验证;

[双红色菱形] 验证通过识别成功;

[双三角形] 需要录入数据库的语言信息;

[红色菱形] 声音特征与权限录入数据库;

(添加微信公众号可查看大图)

学习的最快方法就是做实践,一个项目会涉及多方面知识,一点点学习消化,学无止境。

" 本设计制作为原创公益教学课程,内容版权归所有,仅供学习,不得用于获利性活动。"

——梦魄@行动(2018/10/15)

lu yuan bin

" The quickest way to learn is to practice, a project will involve a wide range of knowledge, a little learning digestion, endless learning."

"This design is an original public welfare teaching course. The copyright of the content belongs to. It is only for study and not for profit-making activities."

——Dream doing(2018/10/15)

luyuanbin

千 里 优 选 教 学 基 地

微信公众号:qlyxgy

03021

主 页 入 口

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181015G096LK00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券