我正计划创建一个语音识别网络,它能识别少量的单词(语音命令),并从谷歌( google )那里看到语音命令数据集。除了可用的数据集外,我还计划增加几个词,如“移动”、“保存”等,这些词不是谷歌数据集的一部分。
是否有任何方法或其他来源可以为这些单词创建/查找数据集?由于许多在线数据集都可用于句子和语音记录,因此我正在考虑编写一个脚本,该脚本可以遍历可用的抄本,找到所需单词的位置,并对音频进行物理裁剪,然后将
我一直在使用Windows创建一个语音识别uwp应用程序。我一直在浏览这个链接的例子,它的工作原理很好,但出于好奇,我想看看在play命令中使用任何组合词是否会识别语音,例如'play item‘...now,正确的组合应该是’play the item‘,任何其他单词的组合都不应该被sdk选择为匹配词。