前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Linux 使用 pocketsphinx 做中文语音识别

Linux 使用 pocketsphinx 做中文语音识别

作者头像
kongxx
发布2019-01-03 10:34:02
5K0
发布2019-01-03 10:34:02
举报

前一篇博客说了一下怎么在 Windows 平台使用 pocketsphinx 做中文语音识别,今天看看在 Linux 上怎办实现。

由于 pocketsphinx 没有提供 Linux 的二进制包,因此我们需要自己根据源码编译。

下载

从下面地址下载源代码

https://sourceforge.net/projects/cmusphinx/files/

这里,我使用的是 sphinxbase-5prealpha.tar.gz 和 pocketsphinx-5prealpha.tar.gz。

编译

  • 编译 sphinxbase tar zxvf sphinxbase-5prealpha.tar.gz mv sphinxbase-5prealpha sphinxbase cd sphinxbase ./configure make sudo make install
  • 编译 pocketsphinx tar zxvf pocketsphinx-5prealpha.tar.gz cd pocketsphinx-5prealpha ./configure make clean all sudo make install

下载模型文件

模型文件下载地址

https://sourceforge.net/projects/cmusphinx/files/Acoustic and Language Models/ 其中 Mandarin 为中文普通话,下载之后我们可以看到

  • 声学模型:zh_broadcastnews_16k_ptm256_8000.tar.bz2 (需要解压)
  • 语言模型:zh_broadcastnews_64000_utf8.DMP
  • 拼音字典:zh_broadcastnews_utf8.dic

测试中文语音识别

  • 首先准备一个中文音频文件(要求:.wav 格式,采样频率 16000HZ,单声道)
  • 将下载的中文模型文件和解压后的 pocketsphinx 目录放到同一个目录下,这里假定就叫 “test”。
  • 进入“test”目录,然后运行下面的命令
代码语言:javascript
复制
pocketsphinx\bin\Release\x64\pocketsphinx_continuous.exe -hmm zh_broadcastnews_ptm256_8000 -lm zh_broadcastnews_64000_utf8.DMP -dict zh_broadcastnews_utf8.dic -infile myfile-16000.wav > myfile.txt
  • 运行完毕后,查看 myfile.txt 文件,内容即是程序识别出来的中文。
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2019.01.02 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 下载
  • 编译
  • 下载模型文件
  • 测试中文语音识别
相关产品与服务
语音识别
腾讯云语音识别(Automatic Speech Recognition,ASR)是将语音转化成文字的PaaS产品,为企业提供精准而极具性价比的识别服务。被微信、王者荣耀、腾讯视频等大量业务使用,适用于录音质检、会议实时转写、语音输入法等多个场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档