在python中使用google语音识别时出现‘音频数据必须是音频数据’错误

文章/答案/技术大牛

发布

1回答

Google语音API音频在流模式下太慢

我正在尝试将我的UDP音频数据传递到，它运行得很好。不过，我有个问题：当我开始识别时，我在等待软件包，因此没有数据被传递到Google。当包出现时，我开始将它们发送到API，它返回一个错误：音频数据流太慢了。请大致实时地传输音频数据。因此，问题是-当连接到Google之后出现延迟，并且在发送

浏览 3提问于2017-04-03得票数 1

回答已采纳

1回答

python pexpect.spawn及其使用过的设备

、、、、

我正在使用python中的pexpect从我的家庭自动化项目的音频输入中接收连续的音频数据。有没有办法暂停使用我的音频设备？或者我可以在两个独立的程序/脚本中使用音频设备吗？我想做的是:使用语音识别(julius)来听关键字。对于更复杂的命令，我想使用Google的

浏览 1提问于2014-03-19得票数 0

3回答

、、、、

我正在尝试用python加载音频文件，并使用google语音识别对其进行处理问题是，与C++不同，python不显示数据类型、类，也不允许您通过创建新对象和重新打包数据来访问内存来在一种数据类型和另一种数据类型之间进行转换我不明白在python中怎么可能从一种数据类型转换成另一种数据

浏览 79提问于2020-03-27得票数 4

3回答

基于音频流Python的Google流语音识别

、、、

我搜索了Google的所有可用文档，但我找不到Python中的音频流上的流式语音识别示例。有人能指导我如何对音频流执

浏览 13提问于2017-05-21得票数 10

1回答

Python中的Google语音识别API

、、

我正在使用python中的google speech to text API来使用此函数将语音转换为文本我的问题是，这些数据是否存储在google中？这些都是非常敏感的数据，我不希望它们存储在google</e

浏览 34提问于2021-03-04得票数 1

回答已采纳

1回答

Google语音到文本引擎返回RESOURCE_EXHAUSTED

、、、、

我们已经建立了Google语音到文本的服务，我们服务器的所有实例都使用相同的Google云帐户来进行语音到文本服务。然而，其中一个实例是，每当RESOURCE_EXHAUSTED尝试激活语音到文本服务时，它都会不断地得到回复“：资源已经耗尽(例如，检查配额)”。在Google控制台中的服务配额中，我可以看到，我们还远远没有达到极限。无论如何，我没有找到为什么这个实例无法激活语音到文

浏览 11提问于2022-05-11得票数 0

2回答

语音识别中‘InvalidParameterValue.ErrorInvalidVoicedata？

、、

实现‘一句话识别’功能时，发送请求回应‘InvalidParameterValue.ErrorInvalidVoicedata’音频数据无效，传参时data参数提示——（语音数据，当SourceType值为1时必须填写，为0可不写。要base64编码(采用python语言时注意读取文件应该为string而不是byte，以byte格式读取后要decode()。编码后的数据不可带有回车

浏览 1534提问于2019-03-18

2回答

如何从数据库中存储语音并进行识别？

、、、

在web应用程序中将有2个页面，其中一个页面将记录语音并存储在数据库中，在第二个页面中，任何用户都可以在该web应用程序与该语音和数据库匹配后说任何话，它将返回用户名。我已经做了记录部分保存在文件夹中，但不知道我应该使用哪个数据库来存储数据，这些数据可以匹配第二页中的数据，当用户需要那里的名称时</em

浏览 1提问于2017-04-26得票数 2

2回答

MULAW -音频数据传输太慢

、

我对流模式下的语音识别有问题。我的音频源是VoIP电话协议，它允许您以“编码”："Mulaw“、"sampleRateHertz"：8000格式输出音频数据。当我以流模式发送新的部分数据时，会出现一个异常："Status(StatusCode=OutOfRange，Detail=)“音频数据流太慢。请近似实时地传输音频数据。

浏览 4提问于2017-08-21得票数 0

1回答

我们可以使用Google中的Web语音API来识别来自用户麦克风以外的其他来源的语音吗？

、、、、

我想使用Google中的网络语音API来识别来自网页上的HTML5 <video>的语音。是否有一种方法可以将Web语音API与来自用户麦克风以外的其他地方的音频输入一起使用？在MDN ()上，它说：语音识别是通过SpeechRecognition接口访问的，它提供了从音频输入中识别语音上下文的

浏览 6提问于2017-09-06得票数 3

回答已采纳

1回答

基于curl的Google语音识别流API

、、

我想使用谷歌的语音识别API通过流媒体的方法，所以我流我的文件，并获得实时回文本。这是必要的，所以我知道什么时候说了在音频文件。问题是，我没有使用Google提供SDK的任何语言，而且他们的文档没有显示如何在没有SDK的情况下发出这样的请求。有人知道怎么做吗？

浏览 2提问于2017-06-08得票数 0

回答已采纳

1回答

YouTube的自动字幕比产生了更好的效果(模型:视频，UseEnhanced: true)。这怎么可能？

、、、、

这里我的谷歌语音设置给AI发短信以下是语音到文本AI：的输出文件这是视频链接：Google to Text的SRT (由YouTube分配的时间)：例如 Google文字演讲: Represent the这是我用来提取视频音频的命令：ffmpeg -i &q

浏览 5提问于2020-10-12得票数 4

2回答

IBM Watson Python错误- SpechtoTextV1

、

我一直在尝试使用IBM Watson speechtotext been。然而，它适用于短长度的音频文件，但不适用于大约5分钟的音频文件。它显示以下错误"watson {'code_description'：'Bad Request'，'code'：400，' error '：‘30秒未检测到语音。’}“ 我在用沃森的试用账号。或者在下面的代码中出现bug。Python</

浏览 0提问于2017-04-25得票数 5

2回答

Google speech to text api / Google cloud speech解决方案中的用户数据隐私

、

当我使用Google speech to text api或google cloud speech solution时，数据隐私保持在什么级别。我想知道这一点，因为我正在开发一个将音频文件转换为文本的应用程序，这些文件可能包含用户敏感数据。

浏览 1提问于2017-06-16得票数 13

1回答

如何使用google* convert将语音转换为基于印度口音的文本*

、、、、

我正在尝试使用google could APIs转换语音到文本，像这样的gcloud ml speech recognize-long-running当我使用--language-code='en-US，这段代码，我能够转换完美，文本是基于音频的US，口音或UK。当我试图转换印度口音时，这个文本完全错误，我尝试过en-in，但没有用。我如何转换？：这里我上传(.wav)音频文件，并转换为文本。如何通过google coul

浏览 11提问于2021-07-09得票数 0

2回答

如何在iphone中使用AVAudioRecorder识别语音

、、

我正在使用AVAudioRecorder .if I点击录音按钮，录音应该start/save后才能识别出声音。

浏览 0提问于2012-08-07得票数 0

回答已采纳

4回答

如何实时处理音频？

、

我有一些通过麦克风输入的音频。我把它录在“奥迪”里，它看上去像下面所示。我想实时处理这个音频。我主要想做的是：是否有任何Python模块或C库允许我这样做？

浏览 1提问于2013-06-26得票数 7

1回答

Google语音API流

我试图用合并方法将我的PBX连接到Google，但是由于我需要记录语音，将它发送到API，等待响应并将其处理回来，所以不可能进行正常的会话或尝试使用正常的会话/处理语音来进行实时服务。类似于Alexa/Google。我没有找到对象的任何内容：

浏览 3提问于2017-01-19得票数 2

回答已采纳

2回答

如何检测google* cloud platform机器学习语音api中的语言*

、、

是否有使用Google Cloud Platform Machine Learning的Speech API自动检测口语的选项？表示支持的语言列表，用户需要手动设置该参数才能进行语音转文本。

浏览 0提问于2017-05-23得票数 8

2回答

除了谷歌，还有什么语音识别API可以返回临时结果吗？

、、、、

我正在寻找一个语音识别API，它在用户说话时返回临时结果，类似于谷歌在其主页()上所做的事情。我正在寻找一个API，支持法语。我想要做的是创建一个与谷歌语音搜索类似的web应用程序。Google不推荐用于专业开发，因为它经常变化，而且没有完整的文档化。IBM沃森不支持法语细微差别产品似乎不适合于web应用程序。

浏览 6提问于2015-09-30得票数 2

回答已采纳

点击加载更多

Google语音API音频在流模式下太慢

python pexpect.spawn及其使用过的设备