音频识别 - 腾讯云开发者社区

如果我停止识别并重新启动，它会再次要求麦克风许可。它是否有任何想法暂停识别，并在发言结束后继续？

浏览 7提问于2019-04-20得票数 0

1回答

使用SAPI 5.3 Speech API进行声学训练

、、

更具体地说，如果您有一个文本文件和一个说出该文本的用户的音频文件，您会执行什么序列的SAPI调用来使用该文本和音频训练用户的配置文件？例如，您必须进行各种调用以使用与您的音频匹配的文本设置语法，并进行其他调用以连接音频，以及对各种对象进行其他调用以表示“您现在可以开始了”。但是，什么是相互依赖关系--在发生什么之前必须发生什么？如果你使用音频文件而不是系统麦克风进行输入，这是否会使相对计时变得不那么宽松，因为识别器不会一直坐在那里听，直到扬声器听对了为止？

浏览 0提问于2008-11-18得票数 9

1回答

一句话识别返回结果问题？

一句话识别返回的结果如下：有时会只返回个汉字“嗯” 请问这是什么原因导致的呀

浏览 529提问于2019-05-10

1回答

有没有办法让Microsoft Speech SDK只关注我以编程方式查找的命令？

、、

我们更倾向于只关注我们的应用程序被编程识别的十几个命令。有没有办法通过关闭其他功能来只关注这些命令？

浏览 0提问于2012-06-08得票数 2

1回答

在音频文件中查找音频剪辑

、

我经常从大的音频文件中剪辑音频片段，这些文件通常有30到60分钟长。有数百个，可能是数千个这些音频文件。通常情况下，一切都很好，但有时我想回去重新听听我摘录的内容背后的一些背景。最近，我在摘录中加入了文件名以供参考，但我想知道是否有任何方法可以搜索音频文件。从字面上讲，这不是大多数关于这个话题的结果所提出的“语音识别搜索”。我有实际的，准确的原始音频，如果我可以让脚本扫描文件夹中的所有音频文件，看看剪裁后的音频文件是否出现在其中任何一个文件中，那就太棒

浏览 0提问于2020-12-14得票数 2

2回答

语音识别录音文件转文字，返回文字用时多久？

浏览 465提问于2022-06-15

2回答

录音文件识别和录音文件识别极速版的区别？

浏览 308提问于2022-06-15

1回答

Google语音API现场识别

、、、

我想知道是否有可能用这个rest进行某种livespeech识别。我可以提出一个单一的要求，但我想要流我的音频数据和处理结果随着时间的推移。

浏览 1提问于2018-09-12得票数 0

回答已采纳

2回答

MS SpeechRecognitionEngine录制基础音频

我正在使用微软的System.Speech SpeechRecognitionEngine进行口述，我需要能够记录所有正在处理的音频，同时对其执行语音识别。现在，我可以很好地进行语音识别，并且可以获得所识别内容的音频。但是，我需要能够同时保存音频流，以便以后可以使用语音识别中的元数据从整个音频流中获取附加信息。这样做的适当方法是什么？

浏览 0提问于2013-08-02得票数 3

3回答

基于音频流Python的Google流语音识别

、、、

我搜索了Google的所有可用文档，但我找不到Python中的音频流上的流式语音识别示例。有人能指导我如何对音频流执行流语音识别吗？

浏览 13提问于2017-05-21得票数 10

1回答

Microsoft语音识别速度

、、

我正在开发一个使用微软语音识别器的小练习应用程序。对于我正在做的事情，我似乎无法让它足够快地识别单个单词。我希望能够正常说话，系统会从我说的话中抓取“关键字”，并产生一个字符串。

浏览 0提问于2011-08-15得票数 7

回答已采纳

1回答

Google语音到文本引擎返回RESOURCE_EXHAUSTED

、、、、

我们已经建立了Google语音到文本的服务，我们服务器的所有实例都使用相同的Google云帐户来进行语音到文本服务。无论如何，我没有找到为什么这个实例无法激活语音到文本服务的原因(其他服务器实例工作得很好)，我也没有在Google服务中找到显示我设置的语音到文本服务访问失败的日志。

浏览 11提问于2022-05-11得票数 0

1回答

非英文窗口系统上语音识别

、、、

我无法在我的荷兰语windows系统上使用语音识别应用程序，因为它只在英文版本上可用。这个是可能的吗？有这样的库吗？

浏览 1提问于2013-11-05得票数 2

1回答

录音识别sdk的录音文件如何保存？

、

实时语音识别sdk 的录音文件如何保存？停止识别后如何继续任务，而不是重新开始。

浏览 578提问于2019-07-16

2回答

MCI_RECORD参数的改变是否影响SAPI语音识别？

mciSetParms.wBitsPerSample = 8;mciSetParms.nSamplesPerSec = 8000; 会不会影响SAPI的语音识别

浏览 0提问于2010-01-20得票数 1

3回答

音频指纹库(java)

、

有没有用Java编写的音频指纹库？类似于用编写的C++或C#。

浏览 5提问于2010-04-03得票数 12

1回答

如何使用python找出两个语音文件的差异

、、、、

我想要两个比较两个语音文件，并找出他们之间的差异。假设我有一个音乐轨道原始文件和另一个我从音乐中读出的文件，我想让两个文件比较这两个文件并找出它们的音素之间的差异。实际上，单词对我来说并不重要，重要的是音素之间的相似度，我想找出类似于相似度百分比的值。我更喜欢用Python实现一些东西。

浏览 5提问于2013-07-07得票数 7

1回答

如何提取与给定音频剪辑对应的视频部分？

、、、、

我有一个视频剪辑，还有一个音频剪辑。如何将视频剪辑剪裁到音频剪辑中提取的部分？我认为解决办法将包括： <03:05,09:55>);Trim 自动识别视频剪辑中音频剪辑的一对起始位置和结束位置(例如，将视频从识别的起始位置识别到识别的端点(这很容易)。

浏览 5提问于2012-01-19得票数 4

5回答

开源音频模式识别(指纹识别)

、、

有没有开源的音频指纹识别解决方案可以提供“类似Shazam”的解决方案？使用的商业解决方案，但我正在寻找替代方案(即使在准确性和性能方面较差)的开源解决方案。

浏览 0提问于2011-06-08得票数 28

回答已采纳

1回答

Pocketsphinx -音频预处理是否必要/推荐？

、、、、

我正在使用pocketsphinx进行语音识别，使用西班牙语声学模型和JSGF语法，到目前为止效果还不错。然而，我得到了错误的音频识别结果，至少在我的耳朵看来是完全可以理解的(没有太多的背景噪声，采样频率和根据声学模型参数的比特深度等)。此外，这些没有正确识别的音频似乎与正确识别的音频没有太大区别(事实上，对我来说，它们听起来几乎是一样的)。所以，我猜音频中有一些东西使它更难识别，也许是一些噪声频率或其他需要过滤的东西？(背景噪声、

浏览 3提问于2016-06-20得票数 0

点击加载更多