首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >使用哪种语音识别系统?

使用哪种语音识别系统?
EN

Stack Overflow用户
提问于 2015-11-16 17:30:55
回答 2查看 91关注 0票数 0

我想实现以下想法。我需要我的用户打开网页或移动应用程序,并说些什么。用户的语音将被记录到端发送到本地服务器,我希望服务器对其进行处理并生成一些语音输出。

下面是我的问题:

  1. 使用哪种语音识别API?在我的例子中,音频文件将被发送到服务器,然后将被处理。
  2. 我需要识别名字和姓氏。这是一个潜在的问题,因为我并不生活在讲英语的国家,而名字和姓氏对讲英语的人来说可能是相当陌生的。我想通过在语音识别系统的“字典”中添加所需的名称和姓氏来实现这一点,所以我需要一个可以扩展其字典的名称。
  3. 我需要一个自由决定。

那么,我应该使用哪种语音识别API来实现我的想法呢?

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2015-11-16 18:58:34

我曾经成功地使用CMU狮身人面像工具包来进行语音识别。我在Android应用程序中使用了它的一个变体。如果我没记错的话,它确实允许创建一本特定单词的词典,以便能够满足你的需要。

票数 1
EN

Stack Overflow用户

发布于 2015-11-19 11:14:33

我建议您看一下Nuance公司的语音API。它们在市场上是最好的,并且可以在任何平台上使用。我们将它们用于我们的产品LinguSocial,该产品提供几乎实时的语音呼叫翻译,用于移动电话和固定电话,以及机器翻译的视频聊天。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/33741241

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档