腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(3568)
视频
沙龙
1
回答
Pocketsphinx
构建
小
词汇量
模型
model
、
cmusphinx
、
pocketsphinx
我想为口袋狮身人面像(.lm)建立一个
小
的德语词汇
模型
,它只能识别从0到9的德语数字。使用Voxforge de-de
模型
时,性能非常差(几乎无法识别)。我在英语中用类似的方法尝试了TIDIGTS -它使用了一个只包含数字的特殊
模型
。这个可以正常工作。因此,我显然需要
构建
一个只包含我的数字的.lm
模型
-为此,我已经录制了许多wav文件,并将它们转录成所需的XML格式。但是当我查看https://cmusphinx.github.io/wiki/tu
浏览 15
提问于2020-01-27
得票数 1
1
回答
用于jquery移动phonegap应用程序的语音转文本api
javascript
、
jquery-mobile
、
cordova
、
voice-recognition
、
speech-to-text
这款应用程序是一款使用jquery mobile javascript
构建
的phonegap应用程序。它同时适用于Android和IOS。
浏览 4
提问于2013-11-26
得票数 1
2
回答
linux下的简单语音识别
software-recommendation
、
speech-recognition
我看到
pocketsphinx
在软件中心可以作为二进制下载,但是从终端运行它会失败,报告它需要参数,但是我不知道该放什么。我试着安装所有列出的声音
模型
,但我不知道它们是在哪里保存的,也不知道如何让它们工作。我也不知道如何使Sphinx3工作。Sphinx3手册似乎坏了,而口袋狮身人面像没有一个对我来说有意义的例子用法。我正在寻找的东西,得到60%正确的识别麦克风输入有限的
词汇量
和单词,然后可以写到一个文本文件-这些东西存在于80年代末。所以,我知道它的存在,并应该以某种方式起作用。(网络连接是不可以的)
浏览 0
提问于2013-05-20
得票数 17
1
回答
在不使用azure等云服务的情况下,在. net core 3.1 web应用程序中实现语音到文本
asp.net-core
、
speech-to-text
、
pocketsphinx
、
kaldi
、
mozilla-deepspeech
我正在尝试在我的.net核心3.1Web应用程序上实现语音到文本,而不使用任何云服务,如Azure,亚马逊网络服务或谷歌。因此,如果您可以提供如何在.net核心上实现这些apis的简要概述,或者链接到一些文章,这将非常有帮助。
浏览 18
提问于2020-12-30
得票数 0
1
回答
PocketSphinx
无输出
cmusphinx
我在本教程的基础上
构建
了语言
模型
(使用CMUCLMTK)和声学
模型
。
pocketsphinx
_continuous -hmm ... -lm ... -dict ...(我的
模型
和训练集很小)。我的设备运行良好,因为我在英语
模型
中测试了
pocketSphinx
,而且它的性能非常好。 ,还有什么会导致这种奇怪的结果呢?
浏览 2
提问于2012-05-14
得票数 1
4
回答
如何在iphone中将语音转换为文本?
iphone
、
speech-to-text
我想建立一个应用程序,当用户在iphone上说话时,它将转换为相应的文本。在iphone中这是可能的吗?有什么API可以用来做这个吗?
浏览 7
提问于2009-12-18
得票数 1
回答已采纳
1
回答
Word2vec内存和时间消耗吗?
nlp
、
data-science
、
word2vec
我正在尝试用神经网络训练一个Word2Vec
模型
。我的问题如下: 如果我错了,请纠正我: word2vec使用的输入文本与图像没有相同的数量级(就内存而言)?这是否意味着不需要使用GPU来训练word2vec
模型
,顺便说一句,64 to虚拟云机器就足以进行培训了吗?文字训练不能超过5-10Go吗?
浏览 0
提问于2018-10-11
得票数 0
1
回答
Android
PocketSphinx
:从apk安装时没有编写语言
模型
文件
android
PocketSphinx
工作得很好。还创建了一些专门的语音命令字典。当我安装
PocketSphinx
的时候,我会按照说明在我的设备上的/sdcard/android/ edu.cmu.
pocketsphinx
下创建数据和子文件夹。并提供了语言
模型
和dics。我正确地怀疑edu.cmu.
pocketsphinx
文件夹不是在我弟弟的手机上创建的。我把edu.cmu.
Pocketsphinx
-文件夹发送给他,让他手动安装,它可以正常工作。与
构建
路
浏览 2
提问于2012-08-19
得票数 2
1
回答
斯芬克斯列senone.c错误和
pocketsphinx
_continuous bin_mdef.c错误
speech-recognition
、
pocketsphinx
当我正在使用袖珍狮身人面像
构建
僧伽罗语音识别系统时,我遇到了两个主要错误:运行
pocketsphinx
_continuous sphinxtrain命令和命令,我的项目文件夹可以看到。运行狮身人面像运行命令后,我通过创建一个名为/usr/local/share/
pocketsphinx
/model/en-us/的文件夹si,将以下文件复制到
pocketsphinx
语言
模型
默认位置,mixture_weights
浏览 0
提问于2015-07-28
得票数 0
回答已采纳
1
回答
删除稀有单词如何影响
模型
性能?
machine-learning
、
deep-learning
、
nlp
假设您想要
构建
一个文本预测
模型
,并且您的数据集包含500万个words.The唯一单词(
词汇量
为59k)。但是,如果删除所有在整个数据集中出现少于4次的单词,唯一单词的数量将下降到20k。我想知道的是,删除这些罕见的词语是否会以任何方式影响我的
模型
性能?
浏览 5
提问于2022-10-14
得票数 -2
1
回答
词汇表大小SpaCy
模型
'en_core_web_sm‘
machine-learning
、
nlp
、
data-science
、
spacy
我试着在SpaCy
小
模型
中查看词汇表中的单词数量:谢谢!
浏览 6
提问于2019-11-06
得票数 2
回答已采纳
1
回答
word2vec中的词汇表大小与矢量大小
word2vec
、
word-embedding
我有6200个句子的数据(它们是表格"sign_or_symptoms Pathologic_function Pathologic_function“的三重奏),但是这些句子中唯一的单词(
词汇量
)是181个,如何才能训练出这样低
词汇量
的句子的
模型
。是否有任何资源或研究适当的矢量大小取决于
词汇量
?
浏览 1
提问于2018-11-20
得票数 0
回答已采纳
1
回答
Microsoft Speech SDK 11中的语法太多
c#
、
speech-recognition
、
grammar
、
microsoft-speech-platform
我编写了一个简单的语音识别应用程序,可以将语法加载到引擎中。Additional information: Too many grammars have been loaded. Number of grammars cannot exceed 1024. Thread.CurrentThread.CurrentCulture = new CultureInfo("ru-RU"); Thread.CurrentThread.Cur
浏览 2
提问于2014-12-29
得票数 2
回答已采纳
1
回答
Keras,如何用Softmax层的随机抽样来填充嵌入层
keras
、
word-embedding
在我正在
构建
的
模型
中,我有以下层:我希望这个
模型
的下一层是一个嵌入层,它“代表”稠密层的选择。也就是说,我想知道怎么做吗? 问候
浏览 0
提问于2021-04-07
得票数 0
1
回答
如何从cmusphinx词典中删除单词?
voice-recognition
、
cmusphinx
如何删除西班牙语
模型
中未使用的单词?有可能吗?我只想修改这个
模型
的字典,删除未使用的单词。(我现在只想要50个字)。谢谢。
浏览 4
提问于2016-11-12
得票数 0
回答已采纳
1
回答
如何实现"ok google“技术
c++
、
c
、
audio
、
voice-recognition
我读过一些关于语音/语音识别的文章,我想知道它是如何工作的。例如,android上的"ok Google“和类似的案例?最后,如果你们知道一些libs (C/C++,如果可能的话)能够做到这一点,我会很高兴地实现一个“关键字观察器”。
浏览 4
提问于2015-03-09
得票数 1
回答已采纳
1
回答
正确配置
Pocketsphinx
speech-recognition
、
cmusphinx
我一直在运行Debian压缩的VM上安装
Pocketsphinx
0.7。这很好,我可以尝试识别来自files.Having的语音--我已经
构建
了一些python脚本,它们识别了我得到的一堆文件,然后估计了单词错误率。它们使用中描述的gstreamer。到目前为止,我使用的是原始的hmm,这是一本包含我测试数据中的单词的字典,也是我从我的教授那里得到的优化语言
模型
。这应该可以工作,因为它也在生产系统中运行。我现在的问题是,识别性能仍然很糟糕。另一件可能影响性能的事情是,
pocketsphinx
告诉我它没有权限访问hmm,尽管
浏览 1
提问于2012-06-28
得票数 5
回答已采纳
1
回答
如何优化节
模型
的内存占用
nlp
、
stanford-nlp
、
stanza
这意味着我需要存储和加载不同语言的许多节(默认)
模型
。我尝试过的另一件事就是使用我真正需要的处理器,这会减少内存占用,但不会减少那么多。
浏览 4
提问于2020-08-28
得票数 1
回答已采纳
2
回答
Word2Vec
模型
词汇表中的最小单词数?
gensim
、
word2vec
我使用Gensim
构建
了一个Word2Vec
模型
,但是来自most_similar的输出看起来并不合理。是因为我
词汇量
不够吗?如果是的话,是否有关于词汇表大小的大拇指规则?
浏览 5
提问于2021-02-18
得票数 0
回答已采纳
1
回答
如何为自然语言处理项目可视化数据?
nlp
在这一点上,也许使用一个更小的机器学习
模型
--比如决策树--来绘制结果的概率。 像我这样的项目最好的情节是什么?
浏览 0
提问于2019-05-26
得票数 3
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
景联文科技:深度了解语音识别之发音词典及语音数据采集标注
百倍训练效率提升,微软通用语言表示模型T-ULRv5登顶XTREME
语音识别各方面介绍|数据堂
如何使用 Scikit Learn 为机器学习准备文本数据
更年期和大数据:更年期相关ChaCha数据库的邻接图建模
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券