我在词汇表中有一个标记化的单词列表。(它是通过一个集合传递的,所以没有重复的。)我想要生成一个方法,它创建一个字典,允许从单词映射到词汇表中的索引。我的尝试mapping = { w : vocabulary.index(w) for w in vocabulary }是否有一个我可以更有效地使用的库?还是更有效的方法?
谢谢。可
在尝试实现一个特定说话人的语音识别系统时,我遇到了一些问题。当采用说话人15分钟语音的声学模型时,错误率太高(从6-10个单词中识别出正确的1个单词)。我所做的: 1.我已经将阿拉伯语单词转录成俄语,并将它们放入字典中。3.我使用了我从自己研究领域的文本中制作的词典和语言模型。在utf-8中有将近200MB的俄语文本。但只有一小部分阿拉伯语词汇在这本词典里。只有很少的(40个中的4个)音频音轨改编失败,“align audio to