腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何在不获取麦克风权限的情况下重启webkitSpeechRecognition?
如果我停止
识别
并重新启动,它会再次要求麦克风许可。它是否有任何想法暂停
识别
,并在发言结束后继续?
浏览 7
提问于2019-04-20
得票数 0
1
回答
使用SAPI 5.3 Speech API进行声学训练
、
、
更具体地说,如果您有一个文本文件和一个说出该文本的用户的
音频
文件,您会执行什么序列的SAPI调用来使用该文本和
音频
训练用户的配置文件?例如,您必须进行各种调用以使用与您的
音频
匹配的文本设置语法,并进行其他调用以连接
音频
,以及对各种对象进行其他调用以表示“您现在可以开始了”。但是,什么是相互依赖关系--在发生什么之前必须发生什么?如果你使用
音频
文件而不是系统麦克风进行输入,这是否会使相对计时变得不那么宽松,因为
识别
器不会一直坐在那里听,直到扬声器听对了为止?
浏览 0
提问于2008-11-18
得票数 9
1
回答
一句话
识别
返回结果问题?
一句话
识别
返回的结果如下:有时会只返回个汉字“嗯” 请问这是什么原因导致的呀
浏览 529
提问于2019-05-10
1
回答
有没有办法让Microsoft Speech SDK只关注我以编程方式查找的命令?
、
、
我们更倾向于只关注我们的应用程序被编程
识别
的十几个命令。 有没有办法通过关闭其他功能来只关注这些命令?
浏览 0
提问于2012-06-08
得票数 2
1
回答
在
音频
文件中查找
音频
剪辑
、
我经常从大的
音频
文件中剪辑
音频
片段,这些文件通常有30到60分钟长。有数百个,可能是数千个这些
音频
文件。通常情况下,一切都很好,但有时我想回去重新听听我摘录的内容背后的一些背景。最近,我在摘录中加入了文件名以供参考,但我想知道是否有任何方法可以搜索
音频
文件。从字面上讲,这不是大多数关于这个话题的结果所提出的“语音
识别
搜索”。我有实际的,准确的原始
音频
,如果我可以让脚本扫描文件夹中的所有
音频
文件,看看剪裁后的
音频
文件是否出现在其中任何一个文件中,那就太棒
浏览 0
提问于2020-12-14
得票数 2
2
回答
语音
识别
录音文件转文字,返回文字用时多久?
浏览 465
提问于2022-06-15
2
回答
录音文件
识别
和录音文件
识别
极速版的区别?
浏览 308
提问于2022-06-15
1
回答
Google语音API现场
识别
、
、
、
我想知道是否有可能用这个rest进行某种livespeech
识别
。我可以提出一个单一的要求,但我想要流我的
音频
数据和处理结果随着时间的推移。
浏览 1
提问于2018-09-12
得票数 0
回答已采纳
2
回答
MS SpeechRecognitionEngine录制基础
音频
我正在使用微软的System.Speech SpeechRecognitionEngine进行口述,我需要能够记录所有正在处理的
音频
,同时对其执行语音
识别
。现在,我可以很好地进行语音
识别
,并且可以获得所
识别
内容的
音频
。但是,我需要能够同时保存
音频
流,以便以后可以使用语音
识别
中的元数据从整个
音频
流中获取附加信息。 这样做的适当方法是什么?
浏览 0
提问于2013-08-02
得票数 3
3
回答
基于
音频
流Python的Google流语音
识别
、
、
、
我搜索了Google的所有可用文档,但我找不到Python中的
音频
流上的流式语音
识别
示例。有人能指导我如何对
音频
流执行流语音
识别
吗?
浏览 13
提问于2017-05-21
得票数 10
1
回答
Microsoft语音
识别
速度
、
、
我正在开发一个使用微软语音
识别
器的小练习应用程序。对于我正在做的事情,我似乎无法让它足够快地
识别
单个单词。我希望能够正常说话,系统会从我说的话中抓取“关键字”,并产生一个字符串。
浏览 0
提问于2011-08-15
得票数 7
回答已采纳
1
回答
Google语音到文本引擎返回RESOURCE_EXHAUSTED
、
、
、
、
我们已经建立了Google语音到文本的服务,我们服务器的所有实例都使用相同的Google云帐户来进行语音到文本服务。无论如何,我没有找到为什么这个实例无法激活语音到文本服务的原因(其他服务器实例工作得很好),我也没有在Google服务中找到显示我设置的语音到文本服务访问失败的日志。
浏览 11
提问于2022-05-11
得票数 0
1
回答
非英文窗口系统上语音
识别
、
、
、
我无法在我的荷兰语windows系统上使用语音
识别
应用程序,因为它只在英文版本上可用。这个是可能的吗?有这样的库吗?
浏览 1
提问于2013-11-05
得票数 2
1
回答
录音
识别
sdk的录音文件如何保存?
、
实时语音
识别
sdk 的录音文件如何保存?停止
识别
后如何继续任务,而不是重新开始。
浏览 578
提问于2019-07-16
2
回答
MCI_RECORD参数的改变是否影响SAPI语音
识别
?
mciSetParms.wBitsPerSample = 8;mciSetParms.nSamplesPerSec = 8000; 会不会影响SAPI的语音
识别
浏览 0
提问于2010-01-20
得票数 1
3
回答
音频
指纹库(java)
、
有没有用Java编写的
音频
指纹库?类似于用编写的C++或C#。
浏览 5
提问于2010-04-03
得票数 12
1
回答
如何使用python找出两个语音文件的差异
、
、
、
、
我想要两个比较两个语音文件,并找出他们之间的差异。假设我有一个音乐轨道原始文件和另一个我从音乐中读出的文件,我想让两个文件比较这两个文件并找出它们的音素之间的差异。实际上,单词对我来说并不重要,重要的是音素之间的相似度,我想找出类似于相似度百分比的值。我更喜欢用Python实现一些东西。
浏览 5
提问于2013-07-07
得票数 7
1
回答
如何提取与给定
音频
剪辑对应的视频部分?
、
、
、
、
我有一个视频剪辑,还有一个
音频
剪辑。如何将视频剪辑剪裁到
音频
剪辑中提取的部分?我认为解决办法将包括: <03:05,09:55>);Trim 自动
识别
视频剪辑中
音频
剪辑的一对起始位置和结束位置(例如,将视频从
识别
的起始位置
识别
到
识别
的端点(这很容易)。
浏览 5
提问于2012-01-19
得票数 4
5
回答
开源
音频
模式
识别
(指纹
识别
)
、
、
有没有开源的
音频
指纹
识别
解决方案可以提供“类似Shazam”的解决方案? 使用的商业解决方案,但我正在寻找替代方案(即使在准确性和性能方面较差)的开源解决方案。
浏览 0
提问于2011-06-08
得票数 28
回答已采纳
1
回答
Pocketsphinx -
音频
预处理是否必要/推荐?
、
、
、
、
我正在使用pocketsphinx进行语音
识别
,使用西班牙语声学模型和JSGF语法,到目前为止效果还不错。然而,我得到了错误的
音频
识别
结果,至少在我的耳朵看来是完全可以理解的(没有太多的背景噪声,采样频率和根据声学模型参数的比特深度等)。此外,这些没有正确
识别
的
音频
似乎与正确
识别
的
音频
没有太大区别(事实上,对我来说,它们听起来几乎是一样的)。 所以,我猜
音频
中有一些东西使它更难
识别
,也许是一些噪声频率或其他需要过滤的东西?(背景噪声、
浏览 3
提问于2016-06-20
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
清华-得意团队获音频情感识别竞赛冠军
怎么将音频转换成文字?可以识别音频为文字的软件有哪些
音频和视频流最佳选择?SRT协议解析及报文识别
机器学习的应用:进行蜂窝状态的基于音频的识别
专业语音识别技术,轻松实现音频内容的快速阅读和理解
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券