语音识别语言模型和拼音字典文件制作

接我前面的文章,下载 pocketsphinx 和 中文模型文件。

由于模型文件格式有一些要求,所以建议对模型文件的编辑都在Linux上完成。

准备中文语言文件

创建一个文本文件 my.txt,内容如下:

测试
直走
左转
右转
后退
开火
靠喽

生成语音模型文件和字典文件

访问 http://www.speech.cs.cmu.edu/tools/lmtool-new.html 页面,上传 my.txt 文件,然后使用“COMPILE KNOWLEDGE BASE”来生成模型文件。 在生成的列表页面,下载最下面的那个 TAR<???>.tgz,文件名是动态产生的,这里我生成的文件名为:TAR2007.tgz。

下载之。

解压之。

编辑其下的 2007.dic 文件,参考 zh_broadcastnews_utf8.dic 文件加入拼音,比如:

右转 y ou zh uan
后退 h ou t ui
左转 z uo zh uan
开火 k ai h uo
测试 c e sh ib
前进 q ian j in
靠喽 k ao l ou

测试

使用 pocketsphinx_continuous 工具测试,这里使用了一个我提前录制好的音频文件来做测试,其中参数路径根据自己具体文件位置修改。

pocketsphinx_continuous -hmm test/zh_broadcastnews_ptm256_8000 -lm test/TAR2007/2007.lm -dict test/TAR2007/2007.dic -infile test/small.wav

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏JackeyGao的博客

一个超级小的 Django 项目.

当用最简单的代码实现 Django 项目为最基本的要素的时候, 项目可以和微框架一样小.

26520
来自专栏blackpiglet

OpenStack(Pike)连接 Ceph RBD

请注意,本文档假设 Ceph 和 OpenStack 环境已经可用,在此基础上,配置 OpenStack 使用 Ceph RBD 作为镜像和卷的后端存储。

36630
来自专栏程序生活

Stack Overflow在成长时想要成为什么?

在实际的现实生活中,我有时会被别人问到我为谋生到底在做什么事情,这是我思考15秒后的回答:

14530
来自专栏程序员互动联盟

程序员最核心的竞争力是什么?

作为一个在编程领域混了十几年的程序员,从项目实战角度分析,程序员最核心的竞争力是找到最合理解决问题能力,从行业内部规则来讲培养一个标准的软件工程师需要三年的时间...

11830
来自专栏前端新视界

两位数谐音速记

20320
来自专栏黑泽君的专栏

win10电脑休眠后无法唤醒的解决办法

  电脑的休眠功能,为长时间不用的电脑进行了关闭显示、硬盘停转的深度节能模式,不仅节约能源,还保护设备。

49410
来自专栏ATYUN订阅号

加拿大汽车协会推出机器学习算法Gen 2,预测故障并提前送达拖车

加拿大汽车协会(CAA)表示,通过使用其内部开发的新的预测分析技术,它将能够在发生故障之前将拖车送到特定地点。

10220
来自专栏AI研习社

CVPR 2018摘要:第二部分

今天,我们继续推出最近的CVPR(计算机视觉和模式识别)会议系列,这是世界上计算机视觉的顶级会议。 Neuromation成功参加了DeepGlobe研讨会,现...

10020
来自专栏栗霖积跬步之旅

深入理解java虚拟机-第二章:java内存区域与内存泄露异常

java将内存的管理(主要是回收工作),交由jvm管理,确实很省事,但是一点jvm因内存出现问题,排查起来将会很困难,为了能够成为独当一面的大牛呢,自然要了解...

12620
来自专栏Linyb极客之路

MySQL锁

  MySQL的锁机制,就是数据库为了保证数据的一致性而设计的面对并发场景的一种规则。

14310

扫码关注云+社区

领取腾讯云代金券

年度创作总结 领取年终奖励