我想开始学习Prototype based on speech recognition中的语音识别和语音合成有人告诉我使用微软语音服务器(sdk等等)
有了这些,我该如何编写应用程序,以及使用哪种编程语言(开发环境?)?
有人使用过asterisk或SVOX吗?
我需要做的是:
语音识别语音合成
我不一定要成为一个很好的语音识别专家--我认为30 -50个单词对于一开始就足够了。我正在使用windows。
提前感谢
发布于 2010-10-07 21:49:19
如果您选择使用微软语音引擎,可以使用.NET框架API。正如我在另一篇文章中提到的,有两种名称空间(桌面使用的System.Speech和服务器使用的Microsoft.Speech )。您可以使用任何.NET语言进行编程,也可以使用Visual Studio。
几年前在http://msdn.microsoft.com/en-us/magazine/cc163663.aspx上发表了一篇非常好的文章。这可能是我到目前为止找到的最好的介绍性文章。然而,它是基于Vista的预发布版本,并且System.Speech类在WinFX发布时发生了变化。由于这些破坏性的API更改,本文中的示例无法编译,我也没有找到任何更新或勘误表来解释这一点。在互联网上搜索方法名“AppendResultKeyValue”,你会发现一些像http://www.ms-news.net/f3012/system-speech-breaking-changes-3025734.html这样的论坛帖子,人们在论坛上遇到了同样的问题。
这仍然是一篇很好的介绍性文章,非常值得一读。稍加修改,您就可以让示例应用程序正常工作。
发布于 2010-10-07 19:32:09
当我学习计算语言学时,我选择的工具是Praat,这是一个非常混乱的原型工具,可以让你做几乎任何与语音相关的事情。
我不认为它有任何外部API,但它的内部脚本语言对于基本的应用程序来说已经足够了,并且它有很多内置的函数。对于理论和算法的“入门”来说,这并不是太糟糕。
https://stackoverflow.com/questions/3881015
复制相似问题