我想实现以下想法。我需要我的用户打开网页或移动应用程序,并说些什么。用户的语音将被记录到端发送到本地服务器,我希望服务器对其进行处理并生成一些语音输出。
下面是我的问题:
那么,我应该使用哪种语音识别API来实现我的想法呢?
发布于 2015-11-16 18:58:34
我曾经成功地使用CMU狮身人面像工具包来进行语音识别。我在Android应用程序中使用了它的一个变体。如果我没记错的话,它确实允许创建一本特定单词的词典,以便能够满足你的需要。
发布于 2015-11-19 11:14:33
我建议您看一下Nuance公司的语音API。它们在市场上是最好的,并且可以在任何平台上使用。我们将它们用于我们的产品LinguSocial,该产品提供几乎实时的语音呼叫翻译,用于移动电话和固定电话,以及机器翻译的视频聊天。
https://stackoverflow.com/questions/33741241
复制相似问题