从音频文件读取数据时出现语音识别错误

、

as source: print(r.recognize_google(source)) 我得到了这个错误

浏览 55提问于2021-07-16得票数 0

1回答

Google语音到文本引擎返回RESOURCE_EXHAUSTED

、、、、

我们已经建立了Google语音到文本的服务，我们服务器的所有实例都使用相同的Google云帐户来进行语音到文本服务。然而，其中一个实例是，每当RESOURCE_EXHAUSTED尝试激活语音到文本服务时，它都会不断地得到回复“：资源已经耗尽(例如，检查配额)”。无论如何，我没有找到为什么这个实例无法激活语音到文本服务的原因(其他服务器实例工作得很好)，我也没有在Google服务中找到显示我设置的语音到文本服务访问失败的日志。

浏览 11提问于2022-05-11得票数 0

1回答

YouTube的自动字幕比产生了更好的效果(模型:视频，UseEnhanced: true)。这怎么可能？

、、、、

这里我的谷歌语音设置给AI发短信以下是语音到文本AI：的输出文件这是视频链接：这是提供给Google：的视频的音频文件。

浏览 5提问于2020-10-12得票数 4

1回答

使用音频代替麦克风对Julius进行语音识别

、

我需要测试一些音频的语音到文本的转换。此外，还可以模拟音频上的噪声。有没有人知道这样的软件？有人和朱利叶斯共事过吗？对这个库有什么评论吗？

浏览 1提问于2009-09-09得票数 2

1回答

谷歌语音识别是如何工作的？

我知道音频指纹识别音频文件，这是很棒的，但我真正想知道的是Google是如何制作语音识别API的，它们是如何获取音频和返回的单词的。我写了一个宝石来指纹wav音频文件并对它们进行比较，但是如果我用指纹将我的声音与充满指纹的数据库进行比较，可能要花费很长时间。谷歌是怎么做到的？用途：我真的很喜欢语音识别，我想要一个地方开始编码，但我不知道从哪里开始。DragonVoice是语音识别软件的另一个例子，

浏览 5提问于2014-02-27得票数 0

回答已采纳

1回答

如何收集和准备用于语音识别的数据？

、

据我所知，大多数语音识别实现都依赖于二进制文件，这些文件包含他们试图“识别”的语言的声学模型。一个人可以手动抄写大量的演讲，但这需要大量的时间。即便如此，当给出一个包含某些语音的音频文件，并在文本文件中对其进行完整的转录时，单个单词的发音仍然需要以某种方式分开。要匹配音频的哪一部分对应于文本，仍然需要语音识别。这是怎么收集起来的？如果一个人交出了价值数千小时的音频文件及其全部转录

浏览 6提问于2015-08-03得票数 2

回答已采纳

2回答

是否可以用语音识别来识别手机用户？

、

我的一位朋友声称，只需使用语音识别就可以识别每个匿名电话(预付费、skype等)。然而，我到目前为止读到的科学文献是模棱两可的，也就是说，如果你将声音识别应用于有限数量的个体，你可以可靠地识别出谁是谁。然而，如果这个数字达到一定的极限，这就不可能了。所以问题是:使用所有网络参与者的语音识别来进行用户识别是真的可能的，还是我的朋友只是偏执？

浏览 0提问于2018-05-13得票数 4

回答已采纳

1回答

同样的入参(文件格式除外)调用语音识别接口WAV格式正常识别, aac文件报错code4007？

如题, 同样的入参 (文件格式除外) 调用语音识别接口WAV格式正常识别, aac文件报错code4007

浏览 193提问于2022-01-11

1回答

如何使用google convert将语音转换为基于印度口音的文本

、、、、

我正在尝试使用google could APIs转换语音到文本，像这样的gcloud ml speech recognize-long-running当我使用--language-code='en-US当我试图转换印度口音时，这个文本完全错误，我尝试过en-in，但没有用。我如何转换？：这里我上传(.wav)音频文件，并转换为文本。

浏览 11提问于2021-07-09得票数 0

1回答

节点和控制台输出到命令行而不是浏览器

、、

它使用快速框架，并将抄录的音频从麦克风打印到网页和浏览器控制台的文本框中。我看到的其他使用express的例子已经输出到命令行控制台。

浏览 5提问于2016-05-10得票数 1

回答已采纳

1回答

在Python中将语音转换为文本时出错

、、、、

我试图使用语音识别库将语音转换为文本。但是当我运行代码时，它显示了有关音频类型的值错误，我试图将文件格式更改为许多音频格式，例如："PCM、WAV、AIFF、AIFF-C、Mp3、Mp4、FLAC、WebM、wav.但是，它仍然显示出同样的错误。错误： import speech_

浏览 0提问于2021-04-30得票数 2

回答已采纳

1回答

在音频文件中查找音频剪辑

、

我经常从大的音频文件中剪辑音频片段，这些文件通常有30到60分钟长。有数百个，可能是数千个这些音频文件。通常情况下，一切都很好，但有时我想回去重新听听我摘录的内容背后的一些背景。最近，我在摘录中加入了文件名以供参考，但我想知道是否有任何方法可以搜索音频文件。从字面上讲，这不是大多数关于这个话题的结果所提出的“语音识别搜索”。我有实际的，准确的原始音频，如果我可以让脚本扫描文件夹中的所有音频文件，看看剪裁后的音频文件是否出现</

浏览 0提问于2020-12-14得票数 2

3回答

用于语音转文本(语音识别) iphone的API或SDK

、、、、

嗨，我想有一个语音识别api或sdk，它可以识别用户说的语音，并给出它的文本形式。在我的应用程序中，我需要播放一个音频文件，它的文本已经存在。当音频开始播放时，应突出显示所说的单词(来自音频文件)。除此之外，我在谷歌上搜索了很多api，我偶然发现了，但它不是免费试用的。

浏览 2提问于2010-11-11得票数 4

回答已采纳

1回答

有没有办法通过google cloud speech logging添加业务特定的元数据，与存储在google cloud上的音频文件一起存储？

、、

我们正在与谷歌云语音集成语音到文本转换启用日志。当记录音频文件时，我们还需要存储与音频文件一起存储的附加标识符，以便稍后当我们从google云检索音频文件时，我们可以执行实体到音频文件的关联。我们可以将用户提供的元数据与音频文件一起存储吗？我们要流式传输音频数据进行转换，我们需要存储音频文件+一些由我们提供的元数据。

浏览 24提问于2018-12-20得票数 1

3回答

在Mac OS X Mavericks中是否有API (或任何黑客)来访问增强的听写？

、、、、

我正在尝试找到一种简单的方法将音频文件转录为文本(CMU Sphinx、Julius等对于不了解语音识别、配置语言模型、声学模型等的人来说是困难的)。我想知道是否有办法将我的音频文件传输到MacOS10.9Mavericks的“增强听写”功能中，该功能允许本地和离线语音听写。当我把接插线从耳机插孔插入线路时，我认为我是聪明的，但不幸的是，当你开始口述时，它会使所有其他音频播放静音(任何关于如何禁用静音的建议都会得到我的正确答案)。

浏览 5提问于2013-10-25得票数 5

1回答

离线语音识别回调为何没数据？改如果取回调参数？

、

请问，离线语音识别的回调参数都有哪些？我音频文件请求过去，返回是成功的，回调地址也被调用了4次，但是读不出任何数据。直接从request里面读流都是空的，啥文本信息都没。请问这个是什么原因？

浏览 285提问于2019-06-27

2回答

用于音频的卷积神经网络

、、、、

我想扩展相同的CNN，同时从视频(图像+音频)中提取多模态特征。编辑：我发现音频可以用光谱图来表示。

浏览 3提问于2014-03-18得票数 34

回答已采纳

5回答

C#：使用System.Speech名称空间将WAV文件转录为文本(语音到文本)

、、

但当我尝试它时，它给出了不正确的结果。下面是我采用的vb代码示例。(实际上，我不介意lang，只要它是vb/c#...)。它没有给我适当的结果。对于一个6分钟的文件，它可能会给出5-6个与语音文件完全无关的文本。

浏览 3提问于2009-11-20得票数 8

回答已采纳

8回答

用于语音检测和识别的开放源代码

、、

大部分内容似乎分为三类--按总长度、最长第一项排列顺序:沉默、语音广播和音乐。我计划将所有磁带转换成数字格式，然后再查找录音。最明显的方法是在我做其他事情的时候，把它们都放进后台。

浏览 31提问于2011-04-22得票数 25

1回答

如何在Qt中使用来自麦克风的流音频数据进行ASR

、、

我正在做一个语音识别项目，我的程序可以识别音频文件中的单词。现在我需要处理来自麦克风的音频流。我使用QAudio从麦克风中获取声音数据，而QAudio有一个函数来启动这个过程。此start(* QBuffer)函数将数据写入QBuffer(从QByteArray继承)对象。当我不处理连续流时，我可以随时停止从麦克风录制，并将整个数据从QBuffer复制到QByteArray中，然后

浏览 1提问于2013-09-09得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

Google语音到文本引擎返回RESOURCE_EXHAUSTED

YouTube的自动字幕比产生了更好的效果(模型:视频，UseEnhanced: true)。这怎么可能？

使用音频代替麦克风对Julius进行语音识别

谷歌语音识别是如何工作的？

如何收集和准备用于语音识别的数据？

是否可以用语音识别来识别手机用户？

同样的入参(文件格式除外)调用语音识别接口WAV格式正常识别, aac文件报错code4007？

如何使用google convert将语音转换为基于印度口音的文本

节点和控制台输出到命令行而不是浏览器

在Python中将语音转换为文本时出错

在音频文件中查找音频剪辑

用于语音转文本(语音识别) iphone的API或SDK

有没有办法通过google cloud speech logging添加业务特定的元数据，与存储在google cloud上的音频文件一起存储？

在Mac OS X Mavericks中是否有API (或任何黑客)来访问增强的听写？

离线语音识别回调为何没数据？改如果取回调参数？

用于音频的卷积神经网络

C#：使用System.Speech名称空间将WAV文件转录为文本(语音到文本)

用于语音检测和识别的开放源代码

如何在Qt中使用来自麦克风的流音频数据进行ASR

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐