我想使用CMU Sphinx 5 prealpha进行实时语音识别(用于检测一些热词),并使用以下命令:
pocketsphinx_continuous -inmic yes\
-hmm zero_ru.cd_cont_4000\
-dict ru-dict-min.dic\
-lm ru-cmds-min.lm\
-samprate 16000
我对准确性感到满意,但我注意到了一个滞后。例如,我开始识别并说"hello",Sphinx在1-3秒后打印"hello“(太棒了!),我等待几分钟并再次说"hello”,Sphinx在10-18秒后打印"hello“。我等待了几分钟,然后再次说"hello“,Sphinx在3-7秒后打印出"hello”。任务管理器显示,Sphinx使用了2-17%的CPU。我怎么才能修复它?有什么问题吗?
我使用非常小的文件: ru-dict-min.dic有28个单词,ru-min.lm有24个ngram。
发布于 2018-10-23 05:03:07
语音活动检测器会拾取太多噪声,这就是为什么sphinx在处理上花费了太多时间。
https://stackoverflow.com/questions/52065643
复制相似问题