在使用Google Speech-To-Text进行流式音频转录时，时间偏移是否起作用？

google-cloud-platform、speech-to-text、google-cloud-speech

通过Google Speech-To-Text进行流式音频转录的时间偏移量对我来说不起作用。sampleRateHertz: 8000, },}; 一旦我们获得了WebSockets连接的句柄，我们就会为转录设置回调wordInfo.word}`); console.log(`\t

浏览 31提问于2020-10-31得票数 1

回答已采纳

1回答

Android:录制音频，以便稍后将背景流转换为语音到文本？

android、text、translation、speech

在我的Android应用程序中，我希望能够在线或离线录制语音，然后，当我选择时，将录制的音频块流式传输到Google，以便在后台进行语音到文本的转录，以免影响当前的活动。新的语音记录和流媒体/转录可能会同时进行。我应该研究哪些类来完成上面的任务？谢谢

浏览 12提问于2020-02-03得票数 1

3回答

google cloud speech api返回空结果

google-cloud-platform、google-cloud-speech

我一直在使用Chromium Google Speech API，最近改用Google Cloud Speech API。自从Google cloud speech API发布以来，在识别准确性方面，性能似乎有所下降。我还看到越来越多的“空结果”返回到音频流。我同时将音频流传输到多个不同的服务，Google Cloud Speech API返回空结果，而其他一些服务则返回转录文本。这让我想知道Chromium Spe

浏览 2提问于2016-09-27得票数 6

2回答

如何从google speech api获得每个话语的结果，并将每个音频话语块分别保存为wav文件？

python、python-3.x、google-cloud-platform、google-speech-api、google-speech-to-text-api

我使用下面的python脚本从google speech API获取来自实时流音频输入的预测。问题是，我需要来自google speech API的每个话语的预测，然后还将每个话语的音频保存到磁盘。我不确定，我如何修改脚本来保存每个话语的实时音频，并打印每个话语的结果，而不是连续预测。 #!/usr/bin/env python import reimport time from google</em

浏览 37提问于2020-07-26得票数 6

1回答

Google-speech-api抛出EOF错误，而不是执行音频转录

go、websocket、google-speech-api、dialplan、asterisk-ari

在我的项目中，我在golang开发了一个websocket服务器，它通过ARI控制asterisk频道，并使用google-speech-api在同一频道上执行实时音频转录。在连接时，我想保存音频从一个星号频道到文件，同时发送音频到谷歌，并获得文字记录。音频是由asterisk audiofork应用程序发送的，这样我就可以使用ARI操纵频道，而音频</e

浏览 73提问于2021-10-07得票数 0

回答已采纳

1回答

如何加速谷歌云演讲

google-cloud-platform、streaming、audio-streaming、google-speech-api

我使用的是一个麦克风，它通过浏览器录制声音，将其转换为文件，并将文件发送到java服务器。然后，我的java服务器将文件发送到云语音api，并给我转录。问题是转录是超长的(在2秒的对话中大约3.7秒)。所以我想加快转录速度。要做的第一件事是流式传输数据(如果我在记录的开头开始转录。问题是我并不真正理解这个api。例如，如果我想从源(浏览器/麦克风)转录我的音频流，我需要使用某种JS api，但我在

浏览 3提问于2018-05-16得票数 0

2回答

你建议使用什么来将音频文件转录成.txt？

audio、speech-to-text、google-speech-api、transcription

我正在做一个小型的学校项目，在这个项目中我必须获取大量的音频文件，并将它们转录成.txt文件。我是编程的初学者。到目前为止，我已经使用Google的Cloud Speech API尝试了方法。但是我不能用它来进行批量转录，因为它是通过使用外部软件转换音频到.wav (这可以通过FMPEG太完成，所以没什么大不了的)，并将新的.wav文件分割成<60个部分，因为云语音只能转录<60个部分的时间，这是一个很大

浏览 1提问于2018-06-09得票数 1

1回答

问题是使用GCP服务使用语音转文本服务

c#、google-cloud-functions、speech-to-text

我在GCP中订阅了谷歌语音转文本服务，并尝试使用C#将音频文件转换为文本。当我尝试使用谷歌提供的音频转录请求代码从本地发送音频文件时，收到错误: StatusCode=InvalidArgument，Detail=“请求有效负载大小超过限制: 10485760字节已将音频文件添加到存储桶中，并已使用转录长音频文件代码时遇到错误: StatusCode=Resou

浏览 0提问于2019-09-13得票数 1

2回答

IBM Watson基于会话的语音识别失败，并出现“会话不存在”错误

java、speech-recognition、ibm-watson

我在使用基于会话的语音识别界面时遇到问题。具体地说，我试图将较长的音频流拆分成多个块，一次上传一个，并在最后接收完整的解析文本(而不是从单个来源流式传输分块的音频)。更常见的无状态协议接受(分块的)音频流，并在完成时返回解析的内容。基于会话的方法允许客户端建立持久会话，使用多部分将音频作为多个块上传，并查询结果，这对于处理长流或处理麦克风输入非常有用。我找到了一些和，但这些示例似乎都不起作用(可能已

浏览 2提问于2016-06-16得票数 0

1回答

如何收集和准备用于语音识别的数据？

speech-recognition、training-data

一个人可以手动抄写大量的演讲，但这需要大量的时间。即便如此，当给出一个包含某些语音的音频文件，并在文本文件中对其进行完整的转录时，单个单词的发音仍然需要以某种方式分开。要匹配音频的哪一部分对应于文本，仍然需要语音识别。这是怎么收集起来的？如果一个人交出了价值数千小时的音频文件及其全部转录(不考虑人工转录的问题)，那么如何在一个单词结束和另一个单词开始的正确间隔内分割音频？制作这些声学模型的软件<e

浏览 6提问于2015-08-03得票数 2

回答已采纳

1回答

直接从音频/转录转换为文本(语音识别)

audio、text、mp3、speech-recognition、speech

需要能够转换或转录音频(如从.MP3，其他音频格式)包含语音到文本文本转录使用语音(语音识别)算法在高精度。我需要一种直接将音频文件输入语音识别引擎/API的方法。不希望通过扬声器播放音频并用麦克风捕获它--长音频文件需要相当长的时间，并且会降低音频质量和最终的转录质量。是否存在用于此的web服务、API或代码？是不是对现有的某个服务进行</em

浏览 1提问于2014-05-26得票数 10

回答已采纳

1回答

不正确的结束时间戳

python、google-speech-to-text-api

我试图分析google语音文本是如何为面向web的服务执行的。我试着在测试速度时考虑两个参数。 start_time=time.time() results_list.a

浏览 8提问于2022-02-16得票数 0

1回答

YouTube的自动字幕比产生了更好的效果(模型:视频，UseEnhanced: true)。这怎么可能？

google-cloud-platform、speech-recognition、speech-to-text、google-cloud-speech、google-speech-to-text-api

这里我的谷歌语音设置给AI发短信以下是语音到文本AI：的输出文件这是视频链接：Google to Text的SRT (由YouTube分配的时间)：例如 Google文字演讲: Represent the这是我用来提取视频音频的命令：ffmpeg -i &qu

浏览 5提问于2020-10-12得票数 4

1回答

可以使用Python中的speech_recognition模块来设置语音记录时间的最大时长吗？

python-3.x、speech-recognition

我使用Python语言中的speech_recognition模块。我让它在用listen()录制音频之前使用adjust_for_ambient_noise()。问题是，有时它只是试图似乎永远录制，然后当它最终完成时，它占用了带宽，将它录制的大型音频文件传输到Google进行转录。有没有办法让我指定最大录制时间为5秒？设置timeout=5只是检测开始音频信号所需等待的时间。for audio

浏览 61提问于2019-05-27得票数 1

回答已采纳

1回答

获取正在转换为文本的音频文件的持续时间

python、google-cloud-speech

有没有办法获得我们要转换为文本的音频文件的持续时间(秒)？我们可以在响应正文中看到一个"totalBilledTime“。我们可以认为这是音频的持续时间吗？另外，用于转换为文本的音频文件在大小或时间(持续时间)方面是否有限制？

浏览 36提问于2021-10-19得票数 1

1回答

是否可以通过编程方式使用Chrome标题？

google-chrome、voice-recognition

Chrome 89有一个功能，它可以在播放时从音频/视频中转录英语文本。它甚至可以离线工作，所以它没有联系到谷歌的服务器。是否有任何方法以编程方式使用此功能，例如给它一个音频文件并捕获转录的文本？不过，我确实让它起作用了。

浏览 0提问于2021-03-18得票数 3

1回答

大写单词出现时将Python文本转换为句子

python、split

我正在使用Google Speech-to-Text API，在我转录一个音频文件后，我得到的文本是两个人之间的对话，它不包含标点符号(谷歌的自动标点符号或扬声器二元化功能不支持这种非英语语言)。whatever and this is my problem Can you give me your address please Yes of course 它看起来像一个很大的句子，但我想在出现大写单词时拆分不同的句子Hi my name is whatever and

浏览 12提问于2021-08-11得票数 0

回答已采纳

3回答

有没有可能在亚马逊Alexa skill上动态更新卡片？

aws-lambda、alexa、alexa-skill

我想知道一张卡是否可以通过技能更新，而会话还在进行中。例如，使用情况是流式音频，然后在特定的时间戳之后更新相关的卡。

浏览 3提问于2019-01-17得票数 0

5回答

Android语音识别与录音同时进行

android、android-asynctask、speech-recognition

我的应用程序使用AsyncTask中的MediaRecorder类录制音频，还使用Google API将语音转换为文本-识别器意图-使用这个问题中的代码：我也尝试过在Thread中录制音频，但这是一个更糟糕的解决方案我的问题是我的应用程序在模拟器上工作正常。但由于缺乏语音识别服务，仿真器不支持语音识别。在我的设备上，当我开始录制音频和语音识别时，我的应用程序崩溃了--“意外停止”。然而，当我关闭w

浏览 0提问于2011-08-23得票数 24

2回答

使用WiFi跨iOS设备同步音频的最佳方法是什么？

ios、audio、audio-streaming

基本上，对于我的团队的应用程序，我们需要能够在多个iOS设备上同步音乐。第一种方法是在所有设备上播放音乐，然后向所有设备发送播放命令。一些人会比另一些人更晚得到它，所以这个方法不起作用。这里提到了一个想法，即计算所有设备之间的延迟，并根据延迟在适当的时间发送命令。建议的第二种方式是流式播放音乐。如果我们要实现流，我们应该如何去做呢？是否应使用音频单元、OpenAL等？此外，如果正在进行流式传输，我们将如何确保每个设

浏览 1提问于2013-06-29得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

Android:录制音频，以便稍后将背景流转换为语音到文本？

google cloud speech api返回空结果

如何从google speech api获得每个话语的结果，并将每个音频话语块分别保存为wav文件？

Google-speech-api抛出EOF错误，而不是执行音频转录

如何加速谷歌云演讲

你建议使用什么来将音频文件转录成.txt？

问题是使用GCP服务使用语音转文本服务

IBM Watson基于会话的语音识别失败，并出现“会话不存在”错误

如何收集和准备用于语音识别的数据？

直接从音频/转录转换为文本(语音识别)

不正确的结束时间戳

YouTube的自动字幕比产生了更好的效果(模型:视频，UseEnhanced: true)。这怎么可能？

可以使用Python中的speech_recognition模块来设置语音记录时间的最大时长吗？

获取正在转换为文本的音频文件的持续时间

是否可以通过编程方式使用Chrome标题？

大写单词出现时将Python文本转换为句子

有没有可能在亚马逊Alexa skill上动态更新卡片？

Android语音识别与录音同时进行

使用WiFi跨iOS设备同步音频的最佳方法是什么？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐