Pocketsphinx构建小词汇量模型

model、cmusphinx、pocketsphinx

我想为口袋狮身人面像(.lm)建立一个小的德语词汇模型，它只能识别从0到9的德语数字。使用Voxforge de-de模型时，性能非常差(几乎无法识别)。我在英语中用类似的方法尝试了TIDIGTS -它使用了一个只包含数字的特殊模型。这个可以正常工作。因此，我显然需要构建一个只包含我的数字的.lm模型-为此，我已经录制了许多wav文件，并将它们转录成所需的XML格式。但是当我查看https://cmusphinx.github.io/wiki/tu

浏览 15提问于2020-01-27得票数 1

1回答

用于jquery移动phonegap应用程序的语音转文本api

javascript、jquery-mobile、cordova、voice-recognition、speech-to-text

这款应用程序是一款使用jquery mobile javascript构建的phonegap应用程序。它同时适用于Android和IOS。

浏览 4提问于2013-11-26得票数 1

2回答

linux下的简单语音识别

software-recommendation、speech-recognition

我看到pocketsphinx在软件中心可以作为二进制下载，但是从终端运行它会失败，报告它需要参数，但是我不知道该放什么。我试着安装所有列出的声音模型，但我不知道它们是在哪里保存的，也不知道如何让它们工作。我也不知道如何使Sphinx3工作。Sphinx3手册似乎坏了，而口袋狮身人面像没有一个对我来说有意义的例子用法。我正在寻找的东西，得到60%正确的识别麦克风输入有限的词汇量和单词，然后可以写到一个文本文件-这些东西存在于80年代末。所以，我知道它的存在，并应该以某种方式起作用。(网络连接是不可以的)

浏览 0提问于2013-05-20得票数 17

1回答

在不使用azure等云服务的情况下，在. net core 3.1 web应用程序中实现语音到文本

asp.net-core、speech-to-text、pocketsphinx、kaldi、mozilla-deepspeech

我正在尝试在我的.net核心3.1Web应用程序上实现语音到文本，而不使用任何云服务，如Azure，亚马逊网络服务或谷歌。因此，如果您可以提供如何在.net核心上实现这些apis的简要概述，或者链接到一些文章，这将非常有帮助。

浏览 18提问于2020-12-30得票数 0

1回答

PocketSphinx无输出

cmusphinx

我在本教程的基础上构建了语言模型(使用CMUCLMTK)和声学模型。 pocketsphinx_continuous -hmm ... -lm ... -dict ...(我的模型和训练集很小)。我的设备运行良好，因为我在英语模型中测试了pocketSphinx，而且它的性能非常好。，还有什么会导致这种奇怪的结果呢？

浏览 2提问于2012-05-14得票数 1

4回答

如何在iphone中将语音转换为文本？

iphone、speech-to-text

我想建立一个应用程序，当用户在iphone上说话时，它将转换为相应的文本。在iphone中这是可能的吗？有什么API可以用来做这个吗？

浏览 7提问于2009-12-18得票数 1

回答已采纳

1回答

Word2vec内存和时间消耗吗？

nlp、data-science、word2vec

我正在尝试用神经网络训练一个Word2Vec模型。我的问题如下：如果我错了，请纠正我: word2vec使用的输入文本与图像没有相同的数量级(就内存而言)？这是否意味着不需要使用GPU来训练word2vec模型，顺便说一句，64 to虚拟云机器就足以进行培训了吗？文字训练不能超过5-10Go吗？

浏览 0提问于2018-10-11得票数 0

1回答

Android PocketSphinx:从apk安装时没有编写语言模型文件

android

PocketSphinx工作得很好。还创建了一些专门的语音命令字典。当我安装PocketSphinx的时候，我会按照说明在我的设备上的/sdcard/android/ edu.cmu.pocketsphinx下创建数据和子文件夹。并提供了语言模型和dics。我正确地怀疑edu.cmu.pocketsphinx文件夹不是在我弟弟的手机上创建的。我把edu.cmu.Pocketsphinx-文件夹发送给他，让他手动安装，它可以正常工作。与构建路

浏览 2提问于2012-08-19得票数 2

1回答

斯芬克斯列senone.c错误和pocketsphinx_continuous bin_mdef.c错误

speech-recognition、pocketsphinx

当我正在使用袖珍狮身人面像构建僧伽罗语音识别系统时，我遇到了两个主要错误:运行pocketsphinx_continuous sphinxtrain命令和命令，我的项目文件夹可以看到。运行狮身人面像运行命令后，我通过创建一个名为/usr/local/share/pocketsphinx/model/en-us/的文件夹si，将以下文件复制到pocketsphinx语言模型默认位置，mixture_weights

浏览 0提问于2015-07-28得票数 0

回答已采纳

1回答

删除稀有单词如何影响模型性能？

machine-learning、deep-learning、nlp

假设您想要构建一个文本预测模型，并且您的数据集包含500万个words.The唯一单词(词汇量为59k)。但是，如果删除所有在整个数据集中出现少于4次的单词，唯一单词的数量将下降到20k。我想知道的是，删除这些罕见的词语是否会以任何方式影响我的模型性能？

浏览 5提问于2022-10-14得票数 -2

1回答

词汇表大小SpaCy模型'en_core_web_sm‘

machine-learning、nlp、data-science、spacy

我试着在SpaCy小模型中查看词汇表中的单词数量：谢谢!

浏览 6提问于2019-11-06得票数 2

回答已采纳

1回答

word2vec中的词汇表大小与矢量大小

word2vec、word-embedding

我有6200个句子的数据(它们是表格"sign_or_symptoms Pathologic_function Pathologic_function“的三重奏)，但是这些句子中唯一的单词(词汇量)是181个，如何才能训练出这样低词汇量的句子的模型。是否有任何资源或研究适当的矢量大小取决于词汇量？

浏览 1提问于2018-11-20得票数 0

回答已采纳

1回答

Microsoft Speech SDK 11中的语法太多

c#、speech-recognition、grammar、microsoft-speech-platform

我编写了一个简单的语音识别应用程序，可以将语法加载到引擎中。Additional information: Too many grammars have been loaded. Number of grammars cannot exceed 1024. Thread.CurrentThread.CurrentCulture = new CultureInfo("ru-RU"); Thread.CurrentThread.Cur

浏览 2提问于2014-12-29得票数 2

回答已采纳

1回答

Keras，如何用Softmax层的随机抽样来填充嵌入层

keras、word-embedding

在我正在构建的模型中，我有以下层：我希望这个模型的下一层是一个嵌入层，它“代表”稠密层的选择。也就是说，我想知道怎么做吗？问候

浏览 0提问于2021-04-07得票数 0

1回答

如何从cmusphinx词典中删除单词？

voice-recognition、cmusphinx

如何删除西班牙语模型中未使用的单词？有可能吗？我只想修改这个模型的字典，删除未使用的单词。(我现在只想要50个字)。谢谢。

浏览 4提问于2016-11-12得票数 0

回答已采纳

1回答

如何实现"ok google“技术

c++、c、audio、voice-recognition

我读过一些关于语音/语音识别的文章，我想知道它是如何工作的。例如，android上的"ok Google“和类似的案例？最后，如果你们知道一些libs (C/C++，如果可能的话)能够做到这一点，我会很高兴地实现一个“关键字观察器”。

浏览 4提问于2015-03-09得票数 1

回答已采纳

1回答

正确配置Pocketsphinx

speech-recognition、cmusphinx

我一直在运行Debian压缩的VM上安装Pocketsphinx0.7。这很好，我可以尝试识别来自files.Having的语音--我已经构建了一些python脚本，它们识别了我得到的一堆文件，然后估计了单词错误率。它们使用中描述的gstreamer。到目前为止，我使用的是原始的hmm，这是一本包含我测试数据中的单词的字典，也是我从我的教授那里得到的优化语言模型。这应该可以工作，因为它也在生产系统中运行。我现在的问题是，识别性能仍然很糟糕。另一件可能影响性能的事情是，pocketsphinx告诉我它没有权限访问hmm，尽管

浏览 1提问于2012-06-28得票数 5

回答已采纳

1回答