腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
Google
语音
API
音频
在
流模式下太慢
我正在尝试将我的UDP
音频
数据
传递到,它运行得很好。不过,我有个问题: 当我开始
识别
时
,我
在
等待软件包,因此没有
数据
被传递到
Google
。当包
出现
时,我开始将它们发送到API,它返回一个
错误
:
音频
数据
流太慢了。请大致实时地传输
音频
数据
。因此,问题
是
-当连接到
Google
之后
出现
延迟,并且
在
发送
浏览 3
提问于2017-04-03
得票数 1
回答已采纳
1
回答
python
pexpect.spawn及其
使用
过的设备
、
、
、
、
我正在
使用
python
中
的pexpect从我的家庭自动化项目的
音频
输入
中
接收连续的
音频
数据
。有没有办法暂停
使用
我的
音频
设备?或者我可以
在
两个独立的程序/脚本中
使用
音频
设备吗?我想做的
是
:
使用
语音
识别
(julius)来听关键字。对于更复杂的命令,我想
使用
Google
的
浏览 1
提问于2014-03-19
得票数 0
3
回答
在
python
中
使用
google
语音
识别
时
出现
‘
音频
数据
必须
是
音频
数据
’
错误
、
、
、
、
我正在尝试用
python
加载
音频
文件,并
使用
google
语音
识别
对其进行处理 问题
是
,与C++不同,
python
不显示
数据
类型、类,也不允许您通过创建新对象和重新打包
数据
来访问内存来
在
一种
数据
类型和另一种
数据
类型之间进行转换我不明白
在
python
中
怎么可能从一种
数据
类型转换成另一种
数据
浏览 79
提问于2020-03-27
得票数 4
3
回答
基于
音频
流
Python
的
Google
流
语音
识别
、
、
、
我搜索了
Google
的所有可用文档,但我找不到
Python
中
的
音频
流上的流式
语音
识别
示例。有人能指导我如何对
音频
流执
浏览 13
提问于2017-05-21
得票数 10
1
回答
Python
中
的
Google
语音
识别
API
、
、
我正在
使用
python
中
的
google
speech to text API来
使用
此函数将
语音
转换为文本我的问题
是
,这些
数据
是否存储
在
google
中
?这些都是非常敏感的
数据
,我不希望它们存储
在
google</e
浏览 34
提问于2021-03-04
得票数 1
回答已采纳
1
回答
Google
语音
到文本引擎返回RESOURCE_EXHAUSTED
、
、
、
、
我们已经建立了
Google
语音
到文本的服务,我们服务器的所有实例都
使用
相同的
Google
云帐户来进行
语音
到文本服务。然而,其中一个实例
是
,每当RESOURCE_EXHAUSTED尝试激活
语音
到文本服务
时
,它都会不断地得到回复“:资源已经耗尽(例如,检查配额)”。
在
Google
控制台中的服务配额
中
,我可以看到,我们还远远没有达到极限。无论如何,我没有找到为什么这个实例无法激活
语音
到文
浏览 11
提问于2022-05-11
得票数 0
2
回答
语音
识别
中
‘InvalidParameterValue.ErrorInvalidVoicedata?
、
、
实现‘一句话
识别
’功能
时
,发送请求回应‘InvalidParameterValue.ErrorInvalidVoicedata’
音频
数据
无效,传参
时
data参数提示——(
语音
数据
,当SourceType值为1
时
必须
填写,为0可不写。要base64编码(采用
python
语言
时
注意读取文件应该为string而不是byte,以byte格式读取后要decode()。编码后的
数据
不可带有回车
浏览 1534
提问于2019-03-18
2
回答
如何从
数据
库
中
存储
语音
并进行
识别
?
、
、
、
在
web应用程序中将有2个页面,其中一个页面将记录
语音
并存储在
数据
库
中
,
在
第二个页面
中
,任何用户都可以
在
该web应用程序与该
语音
和
数据
库匹配后说任何话,它将返回用户名。我已经做了记录部分保存在文件夹
中
,但不知道我应该
使用
哪个
数据
库来存储
数据
,这些
数据
可以匹配第二页
中
的
数据
,当用户需要那里的名称
时</em
浏览 1
提问于2017-04-26
得票数 2
2
回答
MULAW -
音频
数据
传输太慢
、
我对流模式下的
语音
识别
有问题。我的
音频
源
是
VoIP电话协议,它允许您以“编码”:"Mulaw“、"sampleRateHertz":8000格式输出
音频
数据
。当我以流模式发送新的部分
数据
时
,会
出现
一个异常:"Status(StatusCode=OutOfRange,Detail=)“
音频
数据
流太慢。请近似实时地传输
音频
数据
。
浏览 4
提问于2017-08-21
得票数 0
1
回答
我们可以
使用
Google
中
的Web
语音
API来
识别
来自用户麦克风以外的其他来源的
语音
吗?
、
、
、
、
我想
使用
Google
中
的网络
语音
API来
识别
来自网页上的HTML5 <video>的
语音
。是否有一种方法可以将Web
语音
API与来自用户麦克风以外的其他地方的
音频
输入一起
使用
?
在
MDN ()上,它说:
语音
识别
是通过SpeechRecognition接口访问的,它提供了从
音频
输入
中
识别
语音
上下文的
浏览 6
提问于2017-09-06
得票数 3
回答已采纳
1
回答
基于curl的
Google
语音
识别
流API
、
、
我想
使用
谷歌的
语音
识别
API通过流媒体的方法,所以我流我的文件,并获得实时回文本。这是必要的,所以我知道什么时候说了
在
音频
文件。问题
是
,我没有
使用
Google
提供SDK的任何语言,而且他们的文档没有显示如何在没有SDK的情况下发出这样的请求。 有人知道怎么做吗?
浏览 2
提问于2017-06-08
得票数 0
回答已采纳
1
回答
YouTube的自动字幕比产生了更好的效果(模型:视频,UseEnhanced: true)。这怎么可能?
、
、
、
、
这里我的谷歌
语音
设置给AI发短信以下
是
语音
到文本AI:的输出文件这是视频链接:
Google
to Text的SRT (由YouTube分配的时间):例如
Google
文字演讲: Represent the这是我用来提取视频
音频
的命令:ffmpeg -i &q
浏览 5
提问于2020-10-12
得票数 4
2
回答
IBM Watson
Python
错误
- SpechtoTextV1
、
我一直
在
尝试
使用
IBM Watson speechtotext been。然而,它适用于短长度的
音频
文件,但不适用于大约5分钟的
音频
文件。它显示以下
错误
"watson {'code_description':'Bad Request','code':400,' error ':‘30秒未检测到
语音
。’}“ 我在用沃森的试用账号。或者在下面的代码中
出现
bug。
Python</
浏览 0
提问于2017-04-25
得票数 5
2
回答
Google
speech to text api /
Google
cloud speech解决方案
中
的用户
数据
隐私
、
当我
使用
Google
speech to text api或
google
cloud speech solution
时
,
数据
隐私保持
在
什么级别。我想知道这一点,因为我正在开发一个将
音频
文件转换为文本的应用程序,这些文件可能包含用户敏感
数据
。
浏览 1
提问于2017-06-16
得票数 13
1
回答
如何
使用
google
convert将
语音
转换为基于印度口音的文本
、
、
、
、
我正在尝试
使用
google
could APIs转换
语音
到文本,像这样的gcloud ml speech recognize-long-running当我
使用
--language-code='en-US,这段代码,我能够转换完美,文本是基于
音频
的US,口音或UK。当我试图转换印度口音
时
,这个文本完全
错误
,我尝试过en-in,但没有用。 我如何转换?:这里我上传(.wav)
音频
文件,并转换为文本。如何通过
google
coul
浏览 11
提问于2021-07-09
得票数 0
2
回答
如何在iphone中
使用
AVAudioRecorder
识别
语音
、
、
我正在
使用
AVAudioRecorder .if I点击录音按钮,录音应该start/save后才能
识别
出声音。
浏览 0
提问于2012-08-07
得票数 0
回答已采纳
4
回答
如何实时处理
音频
?
、
我有一些通过麦克风输入的
音频
。我把它录在“奥迪”里,它看上去像下面所示。我想实时处理这个
音频
。我主要想做的
是
: 是否有任何
Python
模块或C库允许我这样做?
浏览 1
提问于2013-06-26
得票数 7
1
回答
Google
语音
API流
我试图用合并方法将我的PBX连接到
Google
,但是由于我需要记录
语音
,将它发送到API,等待响应并将其处理回来,所以不可能进行正常的会话或尝试
使用
正常的会话/处理
语音
来进行实时服务。类似于Alexa/
Google
。我没有找到对象的任何内容:
浏览 3
提问于2017-01-19
得票数 2
回答已采纳
2
回答
如何检测
google
cloud platform机器学习
语音
api
中
的语言
、
、
是否有
使用
Google
Cloud Platform Machine Learning的Speech API自动检测口语的选项? 表示支持的语言列表,用户需要手动设置该参数才能进行
语音
转文本。
浏览 0
提问于2017-05-23
得票数 8
2
回答
除了谷歌,还有什么
语音
识别
API可以返回临时结果吗?
、
、
、
、
我正在寻找一个
语音
识别
API,它在用户说话
时
返回临时结果,类似于谷歌在其主页()上所做的事情。我正在寻找一个API,支持法语。我想要做的
是
创建一个与谷歌
语音
搜索类似的web应用程序。
Google
不推荐用于专业开发,因为它经常变化,而且没有完整的文档化。IBM沃森不支持法语 细微差别产品似乎不适合于web应用程序。
浏览 6
提问于2015-09-30
得票数 2
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券