pyaudio是语音处理的python库,提供了比较丰富的功能。
所有的短时间特征可以见下图
过程:语音信号分帧,一帧有34个特征。一般20~100ms
pyaudio提供了两类的语音分割 - 有监督的语音分割:需要有提供一些材料,例如,已经训练好的分类器。为此,此库提供了两种算法:分类的方法和隐马尔科夫的算法 - 无监督的语音分割:无监督的或者半监督的,不需要提供知识准备,主要的例子是静音检测,语音聚类,语音缩略图
在做python环境下的语音识别等相关任务时,一般都需要用到这个库。然而,对于第一次安装这个库的时候,发现都装不上,报的错就是:
找不到portaudio.h文件。
针对这个问题,本来以为是PIP安装的时候下载的包错了,后来对着文件名进行搜索了下,原来是pyaudio的运行需要依赖于portaudio这个库。
因此需要从http://portaudio.com/download.html这个网址上下载相应的软件包,然后进行正常的C++编译和安装。
再次运行pip install pyaudio,果然非常顺利就成功了。