我想知道从哪里可以开始语音识别。不是使用库或任何相当“黑盒”的东西,而是我想知道在哪里可以真正创建一个简单的语音识别脚本。我做了一些搜索,发现并不多,但我看到的是,有‘声音’或音节的字典,可以拼凑成文本。所以基本上我的问题是我可以从哪里开始呢?
此外,由于这有点乐观,我也可以(目前)在我的程序中使用一个库。我看到一些speech to text库和API只输出一个结果。这是可以的,但它将是不现实的。我当前的程序已经检查了输入的任何文本的语法和所有内容,因此,如果我有语音转文本软件的前十个结果,那么它可以检查每个结果,并排除任何没有意义的结果。