文章/答案/技术大牛

发布

社区首页 >问答首页 >建立新的声学模型、字典、语言模型用于非常规语言语音识别

问建立新的声学模型、字典、语言模型用于非常规语言语音识别
EN

Stack Overflow用户

提问于 2015-06-25 12:10:13

回答 1查看 4.2K关注 0票数 5

我想建立新的声学模型，新字典，新语言模型为"Sinhala Language speech recognition“僧伽罗语言字符是基于Unicode的。例如，A=අ、I=ඉ、U=උ、KA=ක、BA=බ。我确实通过了面向开发人员的CMUSphinx教程。但这对我没什么帮助。它适用于英语。

语言模型应该是ARPA模型。如何用英语音素映射僧伽罗语单曲，以及如何训练不同声音的语言模型。是否有任何工具可用于生成基于Unicode的语言模型？

speech-recognition

cmusphinx

sphinx4

回答 1

Stack Overflow用户

回答已采纳

发布于 2015-06-25 16:03:16

总的来说，这并不是真正的复杂。首先，你需要把任务分成几个部分:建立语音词典，建立语言模型，建立声学模型。从语音词典开始。

您需要编写一个Python脚本来将unicode输入映射到音译：

රට  r a tt a
එකඟයි   e k a ng a yi
අවසර දිම    a v a s a r a d i m a

基本上，你每写一个对应的音译。这就是您所需要做的，稍后您只需将单词列表输入到脚本中，并获得cmusphinx格式的字典。本部分将在教程中介绍。

http://cmusphinx.sourceforge.net/wiki/tutorialdict

一旦您有了音译工具，您就可以继续使用语言模型。你需要大量的文本来建立语言模型。你可以从维基百科或当地报纸下载短信。然后，您可以使用任何语言模型工具包来创建ARPA模型。它们都支持unicode - SRILM、MITLM、IRSTLM，您可以使用它们中的任何一个。本部分将在教程中介绍。

http://cmusphinx.sourceforge.net/wiki/tutoriallm

第三步是建立声学模型。您需要录制音频或分段现有的录音，并开始培训。本教程还将介绍此部分。

http://cmusphinx.sourceforge.net/wiki/tutorialam

票数 7

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/31050003

复制

相似问题

问建立新的声学模型、字典、语言模型用于非常规语言语音识别
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问建立新的声学模型、字典、语言模型用于非常规语言语音识别EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问建立新的声学模型、字典、语言模型用于非常规语言语音识别
EN