腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
在
使用
Google
Speech-To-Text
进行
流式
音频
转录
时
,
时间
偏移
是否
起作用
?
google-cloud-platform
、
speech-to-text
、
google-cloud-speech
通过
Google
Speech-To-Text
进行
流式
音频
转录
的
时间
偏移
量对我来说不
起作用
。sampleRateHertz: 8000, },}; 一旦我们获得了WebSockets连接的句柄,我们就会为
转录
设置回调wordInfo.word}`); console.log(`\t
浏览 31
提问于2020-10-31
得票数 1
回答已采纳
1
回答
Android:录制
音频
,以便稍后将背景流转换为语音到文本?
android
、
text
、
translation
、
speech
在
我的Android应用程序中,我希望能够在线或离线录制语音,然后,当我选择
时
,将录制的
音频
块
流式
传输到
Google
,以便在后台
进行
语音到文本的
转录
,以免影响当前的活动。新的语音记录和流媒体/
转录
可能会同时
进行
。 我应该研究哪些类来完成上面的任务? 谢谢
浏览 12
提问于2020-02-03
得票数 1
3
回答
google
cloud speech api返回空结果
google-cloud-platform
、
google-cloud-speech
我一直
在
使用
Chromium
Google
Speech API,最近改用
Google
Cloud Speech API。自从
Google
cloud speech API发布以来,
在
识别准确性方面,性能似乎有所下降。我还看到越来越多的“空结果”返回到
音频
流。我同时将
音频
流传输到多个不同的服务,
Google
Cloud Speech API返回空结果,而其他一些服务则返回
转录
文本。这让我想知道Chromium Spe
浏览 2
提问于2016-09-27
得票数 6
2
回答
如何从
google
speech api获得每个话语的结果,并将每个
音频
话语块分别保存为wav文件?
python
、
python-3.x
、
google-cloud-platform
、
google-speech-api
、
google-speech-to-text-api
我
使用
下面的python脚本从
google
speech API获取来自实时流
音频
输入的预测。问题是,我需要来自
google
speech API的每个话语的预测,然后还将每个话语的
音频
保存到磁盘。 我不确定,我如何修改脚本来保存每个话语的实时
音频
,并打印每个话语的结果,而不是连续预测。 #!/usr/bin/env python import reimport time from
google</em
浏览 37
提问于2020-07-26
得票数 6
1
回答
Google
-speech-api抛出EOF错误,而不是执行
音频
转录
go
、
websocket
、
google-speech-api
、
dialplan
、
asterisk-ari
在
我的项目中,我
在
golang开发了一个websocket服务器,它通过ARI控制asterisk频道,并
使用
google
-speech-api
在
同一频道上执行实时
音频
转录
。
在
连接
时
,我想保存
音频
从一个星号频道到文件,同时发送
音频
到谷歌,并获得文字记录。
音频
是由asterisk audiofork应用程序发送的,这样我就可以
使用
ARI操纵频道,而
音频</e
浏览 73
提问于2021-10-07
得票数 0
回答已采纳
1
回答
如何加速谷歌云演讲
google-cloud-platform
、
streaming
、
audio-streaming
、
google-speech-api
我
使用
的是一个麦克风,它通过浏览器录制声音,将其转换为文件,并将文件发送到java服务器。然后,我的java服务器将文件发送到云语音api,并给我
转录
。问题是
转录
是超长的(
在
2秒的对话中大约3.7秒)。 所以我想加快
转录
速度。要做的第一件事是
流式
传输数据(如果我在记录的开头开始
转录
。问题是我并不真正理解这个api。例如,如果我想从源(浏览器/麦克风)
转录
我的
音频
流,我需要
使用
某种JS api,但我
在
浏览 3
提问于2018-05-16
得票数 0
2
回答
你建议
使用
什么来将
音频
文件
转录
成.txt?
audio
、
speech-to-text
、
google-speech-api
、
transcription
我正在做一个小型的学校项目,在这个项目中我必须获取大量的
音频
文件,并将它们
转录
成.txt文件。我是编程的初学者。到目前为止,我已经
使用
Google
的Cloud Speech API尝试了方法。但是我不能用它来
进行
批量
转录
,因为它是通过
使用
外部软件转换
音频
到.wav (这可以通过FMPEG太完成,所以没什么大不了的),并将新的.wav文件分割成<60个部分,因为云语音只能
转录
<60个部分的
时间
,这是一个很大
浏览 1
提问于2018-06-09
得票数 1
1
回答
问题是
使用
GCP服务
使用
语音转文本服务
c#
、
google-cloud-functions
、
speech-to-text
我
在
GCP中订阅了谷歌语音转文本服务,并尝试
使用
C#将
音频
文件转换为文本。当我尝试
使用
谷歌提供的
音频
转录
请求代码从本地发送
音频
文件
时
,收到错误: StatusCode=InvalidArgument,Detail=“请求有效负载大小超过限制: 10485760字节 已将
音频
文件添加到存储桶中,并已
使用
转录
长
音频
文件代码
时
遇到错误: StatusCode=Resou
浏览 0
提问于2019-09-13
得票数 1
2
回答
IBM Watson基于会话的语音识别失败,并出现“会话不存在”错误
java
、
speech-recognition
、
ibm-watson
我
在
使用
基于会话的语音识别界面
时
遇到问题。具体地说,我试图将较长的
音频
流拆分成多个块,一次上传一个,并在最后接收完整的解析文本(而不是从单个来源
流式
传输分块的
音频
)。更常见的无状态协议接受(分块的)
音频
流,并在完成
时
返回解析的内容。基于会话的方法允许客户端建立持久会话,
使用
多部分将
音频
作为多个块上传,并查询结果,这对于处理长流或处理麦克风输入非常有用。我找到了一些和,但这些示例似乎都不
起作用
(可能已
浏览 2
提问于2016-06-16
得票数 0
1
回答
如何收集和准备用于语音识别的数据?
speech-recognition
、
training-data
一个人可以手动抄写大量的演讲,但这需要大量的
时间
。即便如此,当给出一个包含某些语音的
音频
文件,并在文本文件中对其
进行
完整的
转录
时
,单个单词的发音仍然需要以某种方式分开。要匹配
音频
的哪一部分对应于文本,仍然需要语音识别。 这是怎么收集起来的?如果一个人交出了价值数千小
时
的
音频
文件及其全部
转录
(不考虑人工
转录
的问题),那么如何在一个单词结束和另一个单词开始的正确间隔内分割
音频
?制作这些声学模型的软件<e
浏览 6
提问于2015-08-03
得票数 2
回答已采纳
1
回答
直接从
音频
/
转录
转换为文本(语音识别)
audio
、
text
、
mp3
、
speech-recognition
、
speech
需要能够转换或
转录
音频
(如从.MP3,其他
音频
格式)包含语音到文本文本
转录
使用
语音(语音识别)算法
在
高精度。我需要一种直接将
音频
文件输入语音识别引擎/API的方法。不希望通过扬声器播放
音频
并用麦克风捕获它--长
音频
文件需要相当长的
时间
,并且会降低
音频
质量和最终的
转录
质量。
是否
存在用于此的web服务、API或代码?是不是对现有的某个服务
进行</em
浏览 1
提问于2014-05-26
得票数 10
回答已采纳
1
回答
不正确的结束
时间
戳
python
、
google-speech-to-text-api
我试图分析
google
语音文本是如何为面向web的服务执行的。我试着
在
测试速度
时
考虑两个参数。 start_time=time.time() results_list.a
浏览 8
提问于2022-02-16
得票数 0
1
回答
YouTube的自动字幕比产生了更好的效果(模型:视频,UseEnhanced: true)。这怎么可能?
google-cloud-platform
、
speech-recognition
、
speech-to-text
、
google-cloud-speech
、
google-speech-to-text-api
这里我的谷歌语音设置给AI发短信以下是语音到文本AI:的输出文件这是视频链接:
Google
to Text的SRT (由YouTube分配的
时间
):例如
Google
文字演讲: Represent the这是我用来提取视频
音频
的命令:ffmpeg -i &qu
浏览 5
提问于2020-10-12
得票数 4
1
回答
可以
使用
Python中的speech_recognition模块来设置语音记录
时间
的最大时长吗?
python-3.x
、
speech-recognition
我
使用
Python语言中的speech_recognition模块。我让它在用listen()录制
音频
之前
使用
adjust_for_ambient_noise()。问题是,有时它只是试图似乎永远录制,然后当它最终完成
时
,它占用了带宽,将它录制的大型
音频
文件传输到
Google
进行
转录
。 有没有办法让我指定最大录制
时间
为5秒?设置timeout=5只是检测开始
音频
信号所需等待的
时间
。for audio
浏览 61
提问于2019-05-27
得票数 1
回答已采纳
1
回答
获取正在转换为文本的
音频
文件的持续
时间
python
、
google-cloud-speech
有没有办法获得我们要转换为文本的
音频
文件的持续
时间
(秒)?我们可以
在
响应正文中看到一个"totalBilledTime“。我们可以认为这是
音频
的持续
时间
吗?另外,用于转换为文本的
音频
文件
在
大小或
时间
(持续
时间
)方面
是否
有限制?
浏览 36
提问于2021-10-19
得票数 1
1
回答
是否
可以通过编程方式
使用
Chrome标题?
google-chrome
、
voice-recognition
Chrome 89有一个功能,它可以
在
播放
时
从
音频
/视频中
转录
英语文本。它甚至可以离线工作,所以它没有联系到谷歌的服务器。
是否
有任何方法以编程方式
使用
此功能,例如给它一个
音频
文件并捕获
转录
的文本?不过,我确实让它
起作用
了。
浏览 0
提问于2021-03-18
得票数 3
1
回答
大写单词出现时将Python文本转换为句子
python
、
split
我正在
使用
Google
Speech-to-Text
API,
在
我
转录
一个
音频
文件后,我得到的文本是两个人之间的对话,它不包含标点符号(谷歌的自动标点符号或扬声器二元化功能不支持这种非英语语言)。whatever and this is my problem Can you give me your address please Yes of course 它看起来像一个很大的句子,但我想在出现大写单词
时
拆分不同的句子Hi my name is whatever and
浏览 12
提问于2021-08-11
得票数 0
回答已采纳
3
回答
有没有可能在亚马逊Alexa skill上动态更新卡片?
aws-lambda
、
alexa
、
alexa-skill
我想知道一张卡
是否
可以通过技能更新,而会话还在
进行
中。 例如,
使用
情况是
流式
音频
,然后
在
特定的
时间
戳之后更新相关的卡。
浏览 3
提问于2019-01-17
得票数 0
5
回答
Android语音识别与录音同时
进行
android
、
android-asynctask
、
speech-recognition
我的应用程序
使用
AsyncTask中的MediaRecorder类录制
音频
,还
使用
Google
API将语音转换为文本-识别器意图-
使用
这个问题中的代码: 我也尝试过
在
Thread中录制
音频
,但这是一个更糟糕的解决方案我的问题是我的应用程序
在
模拟器上工作正常。但由于缺乏语音识别服务,仿真器不支持语音识别。
在
我的设备上,当我开始录制
音频
和语音识别
时
,我的应用程序崩溃了--“意外停止”。然而,当我关闭w
浏览 0
提问于2011-08-23
得票数 24
2
回答
使用
WiFi跨iOS设备同步
音频
的最佳方法是什么?
ios
、
audio
、
audio-streaming
基本上,对于我的团队的应用程序,我们需要能够
在
多个iOS设备上同步音乐。第一种方法是在所有设备上播放音乐,然后向所有设备发送播放命令。一些人会比另一些人更晚得到它,所以这个方法不
起作用
。这里提到了一个想法,即计算所有设备之间的延迟,并根据延迟
在
适当的
时间
发送命令。 建议的第二种方式是
流式
播放音乐。如果我们要实现流,我们应该如何去做呢?
是否
应
使用
音频
单元、OpenAL等?此外,如果正在
进行
流式
传输,我们将如何确保每个设
浏览 1
提问于2013-06-29
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
谷歌通过定制的深度学习模型升级了其语音转文字的服务
Google解释Pixel手机录音程序背后的语音转文本技术
微软公司向Word添加了转录功能
在自己手机上试用Google Pixel 4的Recorder转录技术
腾讯AI同传亮相博鳌,你该开始python语音识别啦!
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券