腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
视频
沙龙
2
回答
谷歌眼镜--每个应用程序都需要向谷歌注册一个语音触发器吗?
、
我正在尝试将启动语音触发器整合到我的Android应用程序中。的另一篇文章对我的开始非常有帮助。 有一组有限的预定义语音命令。然而,大多数应用程序都有一个独特的应用程序名。预定义命令列表不可能满足每个应用程序的需要。例如,如果我正在开发一个名为“非常愤怒的小鸟”的应用程序,我不可能向Google团队提交一个请求来添加这个语音触发器。是否有一个通用触发器,可以结合起来帮助启动一个特定的应用程序?致以问候。
浏览 1
提问于2014-05-06
得票数 1
回答已采纳
2
回答
一个属性包含另一个属性。
、
我有一个电信数据集,它有很多属性,在这些属性中,有一个“语音邮件计划”属性接受“是”或“否”,另一个属性是“语音邮件呼叫”,它有许多值,但是当“语音邮件计划”为“no”时,总是为零。当从数据集中删除“语音邮件计划”时,分类器的准确性会降低,因此我们如何通知分类器,在零语音呼叫中,No受到阻碍
浏览 0
提问于2019-04-08
得票数 0
1
回答
如何在应用程序后台运行RecognitionListener?
、
、
、
所有人!我正在开发一个用于语音识别的应用程序,该应用程序现在能够识别语音!然而,我需要在应用程序的后台运行这个语音识别代码,它必须一直听命令。对于我的应用程序,我编写了Handler().postDelayed函数,它计算用户发起新活动的时间,并通过延迟5秒来开始监听。我的问题是,它只听2-3秒,它不能识别和再次听。当应用程序运行时,如何在应用程序后台运行语音识别? speechRecognizer1.setRecognitionListener(new RecognitionListener() { @Override public void onReadyF
浏览 14
提问于2020-06-03
得票数 0
1
回答
如何在python2.7上结合语音识别和pyttsx
、
、
我刚接触python,并且一直在学习如何使用python语音识别"pygsr“和pyttsx,现在我想知道如何组合代码来实现一个共同的目标,那就是:当我与程序交谈时,它会给我一个响应。 我在Windows 8上使用python 2.7,并且我已经安装了语音识别和pyttsx库 这是代码pyttsx代码 import pyttsx engine = pyttsx.init () engine.say ( 'Good morning.' ) engine.runAndWait () 这是使用python库的语音识别代码 from pygsr import Pygsr spe
浏览 39
提问于2017-02-10
得票数 1
1
回答
使用UDP套接字的会话启动请求
、
、
、
我一直在使用UDP套接字通过RTP打包发送和接收语音。这很简单。我只是使用用户数据报套接字通过IP发送我的麦克风语音信号(已编码),而在另一端我接收UDP-RTP数据包并解码它们,以便能够在我的扬声器上播放它们。 我已经在互联网上搜索了一段时间,以找到一种使用UDP套接字启动会话的方法。我想要的是在我的对话的两端之间进行一个类似握手的过程,在确认请求之后,媒体层(我在第一段中描述过)将触发并开始发送语音。 我还没有找到任何关于使用UDP套接字的会话请求的教程,但我认为这不是不可能的。(一个用户发送一个建立会话的请求,如果另一个用户确认媒体层启动) 以前有没有人做过这样的事情?欢迎提供任何信息。
浏览 0
提问于2014-01-10
得票数 0
6
回答
有没有一个speech to text API或者一些"hack“,我可以通过它来使用Google的speech to text工具?
、
我认为谷歌的语音转文本功能(谷歌语音邮件的自动转录,YouTube上视频的自动字幕等)令人印象深刻。 我确实查看了Google是否通过API提供了它,但似乎没有(我并不是在责怪他们!)。不过,提供语音到文本功能的云计算服务将非常酷。 有没有什么“黑客”可以用来访问语音到文本。我的架构基本上归结为这一点--一个简短的15-20秒的wav/mp3/其他剪辑作为输入,输出是纯文本。 大家有什么想法吗?
浏览 3
提问于2010-05-12
得票数 4
1
回答
不包括从文本到语音读取器中的韵文数字和脚注字母。
、
是否有任何HTML标记属性或代码片段可用于“隐藏”网页文本的部分,使其不受文本对语音阅读器的影响--例如,Mac上的语音? 具体来说,我正在寻找一种方法,使文本对语音阅读器可以被使用,从一开始忽略数字的诗句和字母,是用来标记脚注在文本。
浏览 6
提问于2014-12-22
得票数 1
回答已采纳
2
回答
在查看语音邮件时,我如何知道拨打了哪个号码?
我有一个谷歌语音号码("A"),转发到两个移动电话线路(" B“和"C")。所有三个号码(A、B或C)留下的语音邮件都收集在我的一个谷歌语音收件箱中。 查看邮件时,如何确定所拨打的号码?
浏览 0
提问于2011-08-24
得票数 7
4
回答
语音合成书?
、
、
、
、
当我还是个孩子的时候,所有的东西都有一个语音合成器,或多或少。几年前,我开始怀疑这些年后这项技术将走向何方,而在一些研究发现这项技术毫无进展之后。储存增加了,使级联合成更像生命,但没有什么其他的改善。 从文本到言语似乎是主要的研究领域。我发现的大多数关于语音合成主题的书都是在实际的语音生成上略读,然后在文本到语音上花费数百页。 我不感兴趣的文本到语音本身,但更多的声音生成。然而,我还没有找到一本对此有好的、实用的解释的书。Concatenative合成很容易掌握,但共振峰是我想要更多的信息。(第三种方法,物理建模,将是一个有利的,但不是所有有趣的)。 这款游戏的特点是,我很想制作一个工具,让低
浏览 0
提问于2011-03-22
得票数 6
回答已采纳
3
回答
我如何在Ubuntu上使用Android使用的语音识别?
、
如果我正在开发一个使用TTS和语音识别的Android应用程序,那么在Ubuntu上哪个库用于相同的语音识别和语音呢? 我假设是从文本到语音,但我不确定哪个语音识别库和字典/学习/校准系统用于语音识别。 我想在Ubuntu桌面上提供这个应用程序。 以及在仿真器外测试它。
浏览 0
提问于2012-09-19
得票数 16
回答已采纳
1
回答
如何在通用语音数据集上训练CNN
、
、
、
、
我正在尝试用数据集训练cnn。我是新的语音识别,无法找到任何链接,如何使用数据集与角化。我遵循这个来构建一个简单的单词分类网络。但是我想用普通的声音数据集来放大它。任何帮助都是非常感谢的。 谢谢
浏览 2
提问于2019-08-01
得票数 3
回答已采纳
2
回答
文本到语音,语音合成,Re:可以做到吗?
、
、
、
所以,我是个新手,在搜索一些信息时遇到了困难。 我想知道这项技术目前是否存在于移动平台上。 我想使用电话来录制某人的语音和短语。然后基于语音,允许另一个人键入文本以检索语音数据。优选地,不使用相同的单词,同时给出短语以捕获产生所需短语所需的正确音节。基本上是文本到语音,但实时输入,有点像《碟中谍2》。例如,我的兄弟给我打电话,我录下他的声音,然后给我妈妈打电话,听起来像我的兄弟。然而,不是像在音乐文件中那样把声音拼凑在一起,而是键入我想说的话。最好是听起来不机械的东西。 希望我的描述是有意义的,任何帮助都会得到很大的重视。 谢谢,威尔
浏览 0
提问于2012-11-23
得票数 1
2
回答
离线语音识别可以提供个识别本地语音数据的demo吗?本地语音数据的如何填充到boby中呢?
离线语音识别可以提供个识别本地语音数据的demo吗?本地语音数据的如何填充到boby中呢?
浏览 571
提问于2018-04-28
1
回答
Android语音信箱GUI应用程序
、
我不喜欢听语音信箱,等待留言结束,试图打电话给他们中的一些,删除其他,找出谁打电话&什么时候,等等. 我想要一个应用程序来显示这类信息的视觉,最好不用我得到一个新的(语音信箱)号码。 我甚至愿意自己对它进行编码,但恐怕不能这样做,因为不同的操作符对他们的语音邮件会有不同的API(如果有的话)。 这样的应用程序是否存在,最好是免费的?或者,可以开发吗?
浏览 0
提问于2015-07-02
得票数 1
回答已采纳
1
回答
语音识别 语音输入输出bucket无法选择?
语音识别-离线 创建模板 选择输入语音源的bucket,选择输出文本结果的结果bucket,但是没有bucket可选择,点击新建bucket,创建之后也是如此。。
浏览 345
提问于2017-09-28
1
回答
使用服务发现将具有相同ID的作业分派到同一工作节点
、
、
、
(提前为菜鸟的问题道歉;我没有使用DevOps的经验。) 在我最近的项目中,我偶然发现了这个问题,我不知道服务发现工具(如Consul/Istio/等)可以寻址。 我们的用例是这样的:我们有一个想法类似于不一致的VoIP应用程序。用户可以加入语音通道并开始通话。然而,要在同一语音通道中的用户之间转发语音数据包,他们的WebRTC语音连接需要由同一服务器进程处理,以便我们可以在内存中处理和转发语音通道中的所有语音数据包。 为此,我们在语音服务(服务V)前面有一个单独的服务(称为服务X),它接收用户加入通道N的请求,并根据N将服务V中的服务器分配给用户。我们需要保证对于相同的信道N,X总是在V中选
浏览 1
提问于2019-08-03
得票数 1
2
回答
是否有语音转发功能?
比如在某个群说一段语音,能否转发这段语音至其他群?
浏览 391
提问于2019-06-21
回答已采纳
2
回答
对于Google文本到语音和三星Tex到语音引擎来说,支持android api的最低水平是什么?
、
、
我在我的Android应用程序中使用文本到语音功能。 这里我使用谷歌文本语音,三星Tex语音引擎。但我不知道android操作系统的哪个版本(api级别)是由谷歌文本到语音,三星Tex支持语音引擎。 我已经浏览了播放商店的信息,但我发现领域“要求Android”是不同的设备。这对我没有帮助。如果我的应用程序用户面临文本到语音问题,我可以提供有关TTS引擎支持版本的信息。 我需要知道支持android版本(或API级别)的最低标准是什么: Google文本到语音 三星Tex语音引擎
浏览 5
提问于2015-08-28
得票数 1
1
回答
必应文本到语音中的语音名称规则
我有一个关于必应文本到语音API的问题。 在中有很多受支持的声音。 有些语音名称有后缀,如“、阿波罗”或"RUS"。如果你能让我知道它们是什么意思那就太好了? 提前谢谢。
浏览 0
提问于2018-08-28
得票数 4
回答已采纳
1
回答
:声音的动态变化
、
在我正在处理的用例中,我希望通过在会话语音字符串中传递一个参数来更改TTS语音。例如, <speak><voice gender="male" variation="1">Hello</voice></speak> actions控制台提到,我们可以覆盖用户的默认区域设置,强制使用特定的TTS语音(如上面所示)。而且确实有用。 问题是:我们如何通过语音标签将声音设置为:en-AU或en-GB?我尝试通过variation、language或name设置它,但它不起作用。 谢谢。
浏览 0
提问于2019-02-13
得票数 2
回答已采纳
1
回答
哪个语音指令有优先权?
、
如何确定哪个语音命令将具有优先权? 例如,有两个应用程序的功能激活语音命令“跳转”。当我发出“跳跃”命令时,哪一个会发射?
浏览 2
提问于2014-04-15
得票数 2
回答已采纳
1
回答
Chrome、Google、Cloud和Android之间有什么区别?
、
、
、
、
Chrome: Google: 云语音API: Android: 我肯定还有更多我错过的。最终,我想找出“好的谷歌”背后的引擎,看看这种技术是否存在于云端。找出谷歌产品之间的区别将是一个好的第一步。
浏览 3
提问于2016-11-26
得票数 2
1
回答
Android语音生物识别技术
、
、
、
、
我计划为android设备建立一个语音认证系统。简单地说,你只需要说一个单词,比如“登录”,手机就可以验证你的身份并自动解锁手机,而不是你必须输入密码或绘制模式的登录屏幕。 我最初计划在windows上实现它,但我担心windows可能不支持语音生物度量。 所以我的问题是,android会支持语音生物指标来解锁手机吗?有没有任何用于android的语音生物度量库? 我做了谷歌搜索,但没有真正找到我想要的。我还发现了一些语音生物识别应用,如细微差别,但它们的认证是为了不同的目的而实现的。 谢谢。
浏览 4
提问于2014-09-10
得票数 5
7
回答
目前国内的语音识别技术达到了什么水准?还存在哪些问题?
现在技术越来越厉害了,前几年还感觉语音打字特别不靠谱,各种语音助手也相当蠢萌,想问下现在国内语音识别发展到什么水平了? 实时且准确的将语音转化成相对应的文本已经达到了什么样的水准?主要还存在哪些方面的问题?
浏览 2281
提问于2018-08-06
1
回答
Twilio如何与Echo (Alexa)接口,将语音信号传送到另一个设备?
、
、
、
我正在尝试建立一个Alexa语音技术,使用户能够通过现有的语音网络(而不是Twilio的基础设施)将VoIP呼叫发送到另一个设备(不是回声设备,而是移动或电话)。我非常清楚AWS Lambda中启动对接收端调用的实现逻辑。但我不清楚的是这个语音信号是如何与回声接口的。从深入的研究可以看出,Amazon没有SIP客户端来接收SIP呼叫。显然,Twilio成功做到了这一点。它使用现有的API通过Echo进行调用。目前还不清楚Twilio是如何将语音回传回声设备的。我看了Alexa的SDK,但是SDK应该与第三方硬件一起使用,而不是在现有的Echo单元上使用。如果有人能给我读几个领域/主题,这将是非
浏览 2
提问于2017-12-13
得票数 3
1
回答
只有当电话没有应答时才转到语音信箱,而不是拒绝电话(星号)
我现在正在使用星号,并观察到语音信箱的电话传输,尽管我已经拒绝了它。 是否只有在没有应答或不可用的情况下才能将电话转接到语音信箱?
浏览 0
提问于2012-05-08
得票数 2
1
回答
Microsoft语音产品/平台之间的差异
、
、
、
、
微软似乎提供了相当多的语音识别产品,我想知道它们之间的区别。 有,或SAPI。但不知怎么的,有着相同的名字。 现在,Microsoft上的认知服务提供了语音服务API和Bing语音API。我认为对于语音到文本,这两个API是相同的。 然后是 (或桌面SAPI)、 (或Server )和。和对这三者之间的差异有一些解释。但我猜想它们是基于HMM的旧的语音识别模型,也不是神经网络模型,这三种模型都可以脱机使用,不需要互联网连接,对吗? 对于Azure语音服务和bing语音API来说,它们是更先进的语音模型,对吗?但我认为在本地机器上无法脱机使用它们,因为它们
浏览 3
提问于2018-06-12
得票数 10
回答已采纳
1
回答
如何为一个IntentService/Service设置多个语音触发器?
、
、
、
现在,我的IntentService有一个语音触发器。 我的名单是这样的: <service android:name="HelloIntentService" > <intent-filter> <action android:name="com.google.android.glass.action.VOICE_TRIGGER" /> </intent-filter> <meta-data android:
浏览 2
提问于2014-02-16
得票数 1
回答已采纳
1
回答
如何在Android中检测音频中的语音成分?
、
、
实时检测音频流的语音部分有什么简单的方法:?我已经阅读了关于使用MFCC,FFT等等的内容。但是我找不到任何明确的解释来说明如何做到这一点。 另外,有没有什么PC程序可以分析wav文件并检测其中是否存在人类语音?
浏览 0
提问于2011-12-19
得票数 0
1
回答
从文本调用Google语音操作-例如构建我自己的语音操作应用程序
、
、
、
我有一个应用程序,我正在使用谷歌的语音识别来获得文本形式的用户语音输入。这行得通,没问题--我得到了文本。 是否可以将我的文本字符串发送到与谷歌语音操作相同的逻辑/引擎进行解析,并让AndroidOS执行正确的操作? 或者,启动一个意图,提示用户进行google语音操作--规范将按此方式执行(例如,listen to...)但如果没有一个匹配的地方,谷歌语音行动,它会广播回我的应用程序与结果文本处理为溢出。
浏览 3
提问于2011-12-06
得票数 0
1
回答
UICollectionView节标题作为可访问性标头
、
、
我有两个关于可访问性和UICollectionViews的问题,我希望得到一些专家的帮助。另一个问题,关于语音而不是阅读顺序,是。我创建了一个演示这两个问题的。 我有一个UICollectionView,在这里我提供自定义的节头。这些节标题是可访问性元素,具有可访问性特征UIAccessibilityTraitHeader集。当启用了Voice,并且用户在集合中水平地滑动时,标题就会被正确地宣布,甚至被声明为一个标头。但是,如果用户向上或向下滑动到下一个标头,则“语音翻转”只会跳到另一个可见的标题上。我假设这是因为当一个视图在集合视图中不可见时,它被从视图层次结构中移除,而Voice不再知道它
浏览 1
提问于2013-04-29
得票数 3
1
回答
无语法C#的语音识别应用编程接口
、
、
、
我正在开发一个程序,其中99%的时间我可以使用标准Microsoft语音识别中的set Grammar来检测所说的单词。然而,在一些情况下,我需要用户说点什么。这永远不会是可预测的。 那么,有没有办法通过MS语音识别来做到这一点呢? 有没有其他的语音识别API(免费),可以处理非预设的单词?
浏览 0
提问于2012-02-10
得票数 3
回答已采纳
1
回答
使用C#语音识别库的语音UI或语音识别
、
、
、
、
作为一名C++开发人员,想知道是否有可能开发语音UI和语音恢复软件,比如Amazon,但是使用c#语音库通过语音命令打开特定的软件? 有人能给我一些洞察力或者让我轻松吗?我使用了来自C#的C#,并编写了一个示例代码,它可以接受我的输入,但问题是它不能完全理解我的输入。 继续做下去是个好主意吗?我觉得自己完全迷路了。任何输入都会预先记录下来。
浏览 4
提问于2017-09-14
得票数 0
回答已采纳
2
回答
如何将演讲拆分成单词
、
、
我在玩语音识别。是否可以将语音拆分为多个单词? 如果可能的话,请推荐我的库支持将语音分割为单词。 谢谢
浏览 3
提问于2013-01-14
得票数 1
1
回答
你能把谷歌地图嵌入到带有get语音指令的应用程序中吗?
、
、
简单的问题,我想我可能已经知道答案是,我不能做我想做的事,但我找不到它的确认。我想要谷歌地图在语音引导下的转向模式内的一个活动在我的应用程序。似乎可以通过他们的API来实现,但我无法确认或找到它是否可以包含语音引导功能,如果没有它,它就不太有价值了,我还不如自己启动已安装的谷歌地图应用程序,让它跳过默认的活动,直接进入语音转模式,而不是将它嵌入到我的活动中。我已经这样做了,但宁愿让它在我的应用程序的一个活动。有没有人确切地知道,除了通过已安装的地图应用程序之外,是否还提供语音引导?此外,任何创造性的想法或解决办法也将很高兴得到赞赏。谢谢。
浏览 4
提问于2017-04-22
得票数 0
回答已采纳
1
回答
使用IRC协议,是否有可能知道发送消息的用户是语音还是op?
、
、
、
、
我正在使用C#库来创建一个IRC机器人。 当解析从IRC中的聊天服务器接收到的PRIVMSG消息时(这是通用的,不特定于我的库选择),有什么方法可以知道用户是语音还是Op? 我可以访问许多领域,如nick、message等等,但我认为没有办法将正常用户与语音或op...is区分开来吗? 谢谢!
浏览 0
提问于2015-08-04
得票数 1
回答已采纳
1
回答
语音输入作为系统认证的安全措施
、
、
、
语音输入作为密码是否是一种有用的安全措施,可以替代强大的密码和生物识别技术(面部、拇指、签名等)? 输入为密码的声音将被保存为系统中的声波文件,而认证的最终用户必须用他/她在保存密码时所说的相同的文字输入他/她的声音。如果系统检测到相同的语音(语音匹配与他/她保存的输入语音作为密码),系统将对他进行身份验证,以登录到系统。 语音输入的安全认证措施的瓶颈和限制是什么?
浏览 0
提问于2022-04-09
得票数 0
回答已采纳
2
回答
斯威夫特的“声音”识别?
、
、
、
我正在研究Swift中的一个应用程序,我正在考虑在我的项目中获得非语音语音识别的方法。 我的意思是,是否有一种方法,我可以接受声音输入,并将它们与一些预定义的声音结合在项目中,如果匹配发生,它应该做一些特定的行动? 有什么办法可以做到这一点吗?我正在考虑打破声音和做检查,但似乎不能得到任何进一步的。
浏览 6
提问于2015-04-22
得票数 2
回答已采纳
1
回答
Windows 8.1和Windows phone 8中的语音识别
、
、
、
、
我想开发应用程序窗口商店8.1和手机8使用语音recognition.Can,这里的任何人都建议我为初学者提供良好的教程。使用microsoft语音sdk或bing识别控件的哪一个??对初学者来说哪一个容易??
浏览 1
提问于2014-01-24
得票数 3
1
回答
谷歌语音到文字的成本?
、
我试图了解谷歌何时收取他们所谓的“溢价”,以及何时适用“标准”成本。主要信息在这里,但不太清楚: 定价-匿名云语音-文本文档 有谁知道哪里有更具体的信息吗?
浏览 2
提问于2019-10-18
得票数 1
回答已采纳
1
回答
在ToolBar中添加语音听写(麦克风)
、
我想做的是: 在工具栏中添加一个按钮(麦克风图像)。 在单击该按钮时,iOS默认的语音听写应该会被调用。 查询:我假设我们不能调用默认的语音听写,而是要确认。他们是否有任何解决办法或任何方法调用语音听写点击按钮在工具栏上? (查询是听写按钮(Mic)在键盘中显示(用于textfield和textview)&在单击该按钮( Mic)听写功能时,我们是否可以将类似的按钮(如Mic)添加到工具栏(用于textfield和textview) &单击按钮听写功能应该发挥。 谢谢
浏览 0
提问于2015-03-24
得票数 2
回答已采纳
1
回答
语音合成接口是由HTML5官方提供的吗?
、
、
、
、
我知道语音合成是用来将文本转换成语音的。但是它是由HTML5官方提供的吗?
浏览 25
提问于2019-01-10
得票数 0
回答已采纳
2
回答
语音文件转文字用哪个接口?
、
语音文件转文字 看到好几个接口分不清 究竟用哪个
浏览 599
提问于2019-01-09
1
回答
是否有可能在twilio自动驾驶仪上播放录音并得到NLU?
、
我想使用twilio自动驾驶仪进行一个出站通话项目,但我不是AWS Polly短信到语音(至少在电话上)的超级粉丝。我认为解决这个问题的一个简单方法是从Google (或其他地方)获取文本到语音的音频,而不是使用这样的方式: { "actions": [ { "say": "Hello World!" }, { "listen": true } ] } 更像是这样的: { "actions": [ { "sa
浏览 0
提问于2019-07-09
得票数 0
回答已采纳
1
回答
有可能检测到用户当前打开的应用程序吗?
我目前正在构建一个语音呼叫应用程序,使用React本地语言,我希望检测用户当前打开的应用程序,用于ex、spotify或instagram,因为我的语音呼叫应用程序最有可能出现在后台。是否有可能检测用户当前打开的应用程序?
浏览 2
提问于2022-03-06
得票数 0
4
回答
Python说话人识别
、
、
我有一个音频文件,两个人的电话通话录音,我需要自动分离两个扬声器的声音。我是语音识别的新手,我看过python的wave模块,但没有找到任何有用的信息。 请帮助一下如何开始。另外,请向我推荐免费的python库,这将帮助我解决这个问题。
浏览 0
提问于2011-09-05
得票数 21
1
回答
在Google语音文本中添加转录本以提高识别能力。
、
、
、
、
在我们的教堂里,有几个尤克伦难民来教堂做礼拜。为了让他们不了解布道,我制作了一个应用程序,实时发送翻译到电报。 我已经在本教程中实现了Google语音到文本API:。 这是很好的,但识别往往不够准确。在Google中,是否可以添加带有转录的音频文件,以便能够了解说话人的输出?我们总是同一个说话者,所以如果我能让谷歌‘了解’扬声器,我认为准确性可以更高。或者有人有另外的想法如何提高准确性?我确实尝试了语音适应性增强(),但这并没有多大帮助。
浏览 10
提问于2022-05-16
得票数 4
2
回答
如何在Iphone中将语音转换为支持多语言和快速响应的文本?
、
、
我用来将语音转换为文本的语音sdk,并给出缓慢的响应,如果有任何其他Sdk可以提供快速响应,支持多种语言… 如果您有任何示例或使用任何其他Sdk,而不是提供给我… 提前感谢....
浏览 3
提问于2012-10-31
得票数 2
1
回答
语音服务器是GVoice提供的吗?聊天室如何创建?
语音服务器是GVoice提供的吗?聊天室如何创建? [附加信息]
浏览 447
提问于2018-08-09
1
回答
面向C++的XCode语音识别库
、
、
、
我想添加一个语音识别功能到我的C++应用程序,用XCode编程。我做了一些语音识别库的搜索,这里是最好的候选人: OpenEars CMUSphinx 许愿 然而,这些解决方案中没有一个是令人满意的,原因有几个(这可能不是一个100%真实的陈述)。 我的问题是: 您曾经尝试过在C++程序中使用XCode的语音识别库吗? 您对使用哪个库/框架有建议吗? 如果已经做了一些工作,是否可能有一个基本的示例代码?(只是开始.) 注意:我想要创建的语音识别功能非常简单:10个单词(英文)在每次说和识别时增加10个变量,就是这样。
浏览 2
提问于2013-09-12
得票数 0
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
主流语音聊天sdk哪个好
如何语音识别翻译?语音识别翻译软件哪个好?
ai智能语音机器人哪个好
怎么文字转语音?文字转语音朗读软件哪个好
文字转语音软件哪个好?今天告诉你免费文字转语音软件哪个好用
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
云直播
活动推荐
运营活动
广告
关闭
领券