前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >近期分享干货,使用python实现语音文件的特征提取方法

近期分享干货,使用python实现语音文件的特征提取方法

作者头像
Python编程大咖
发布2019-03-26 11:35:39
1.2K0
发布2019-03-26 11:35:39
举报
文章被收录于专栏:Python编程大咖

python编程语言无疑是人工智能最重要的语言之一,但是其中语音识别是当前人工智能比较热门的方向,百度的小度机器人、阿里的天猫精灵等其他各大公司都推出了各自的语音助手机器人,其识别算法主要是由RNN、LSTM、DNN-HMM等机器学习和深度学习技术做支撑。但训练这些模型的第一步就是将音频文件数据化,提取当中的语音特征。

MP3文件转化为WAV文件

录制音频文件的软件大多数都是以mp3格式输出的,但mp3格式文件对语音的压缩比例较重,因此首先利用ffmpeg将转化为wav原始文件有利于语音特征的提取。其转化代码如下:

在这里插入图片描述
在这里插入图片描述

读取WAV语音文件,对语音进行采样

利用wave库对语音文件进行采样。

代码如下:

在这里插入图片描述
在这里插入图片描述

绘制声波折线图与频谱图

代码如下:

在这里插入图片描述
在这里插入图片描述

首先利用百度AI开发平台的语音合API生成的MP3文件进行上述过程的结果。

声波折线图

在这里插入图片描述
在这里插入图片描述

频谱图

在这里插入图片描述
在这里插入图片描述

全部代码

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

以上这篇就是小编分享的使用python实现语音文件的特征提取方法。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2019年02月12日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
语音识别
腾讯云语音识别(Automatic Speech Recognition,ASR)是将语音转化成文字的PaaS产品,为企业提供精准而极具性价比的识别服务。被微信、王者荣耀、腾讯视频等大量业务使用,适用于录音质检、会议实时转写、语音输入法等多个场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档