腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
4
回答
如何
使用
python
批量
/
批量
转录
wav
文件
?
python
、
ibm-cloud
、
speech-recognition
、
ibm-watson
、
speech-to-text
我正在尝试
使用
我的
python
应用程序来
转录
文件
夹中的多个
文件
,并加快这一过程。inplace=True) test4.to_csv("Call 8.csv") 我
如何
才能
转录
文件
夹中的多个
文件
,而不是一次
转录
一个
文件
?我可以多次运行此脚本,但我希望将其自动化,以便它从
文件
夹中
浏览 76
提问于2021-03-03
得票数 6
回答已采纳
1
回答
如何
在Azure中进行语音识别并立即完成
azure
、
speech-recognition
、
microsoft-cognitive
、
voice-recognition
我
使用
this example from Azure -连续识别。但是,我需要等待很长时间才能完成识别,例如1小时的语音
文件
。 有没有可能让Azure立即完成识别?目前,识别率约为1:1,即识别1小时的
文件
需要1小时。我希望这件事能在1:60完成。
浏览 126
提问于2021-11-04
得票数 1
1
回答
谷歌语音到文本不能正常工作与很短的音频(单个词)
speech-recognition
、
speech-to-text
、
google-speech-api
、
google-speech-to-text-api
我正在测试和流媒体音频以及
wav
文件
。我
使用
来自电话的音频: 8000采样率,8位,混音编码。Google配置是适当设置的。有人知道为什么会这样吗?怎么修呢?
浏览 6
提问于2021-12-28
得票数 1
回答已采纳
1
回答
期望的音频采样率与实际不匹配?
bash
、
shell
、
audio
、
speech-recognition
、
pocketsphinx
我正在尝试
使用
袖珍狮身人面像
转录
音频
文件
。下面是我需要
转录
的一个音频
文件
:$ soxi 116-288045-0000.flac.
wav
Input File : '116-288045-0000.flac.
wav
',我做了一些预处理
浏览 1
提问于2017-10-19
得票数 0
2
回答
如何
将一个
文件
扩展名的
文件
与一个不同扩展名的不同
文件
互换,并保持目录结构?
python
、
directory
我从事音频工作,我需要一些由第三方
转录
的
文件
。为此,我必须用我压缩的.mp3s换出.
wav
文件
的整个目录,同时保持
文件
目录不变。大约有20,000个
文件
。例如:Folder1 sound1.
wav
Folder 1b sound4.
wav
Folder2
浏览 0
提问于2018-05-19
得票数 0
1
回答
如何
使用
OneDrive存储音频
文件
,而不是
使用
Azure Blob进行
批量
语音
转录
?
speech-recognition
、
azure-cognitive-services
、
transcription
我想通过OneDrive
使用
Azure认知服务语音,而不是
使用
Azure blob存储位置。这个是可能的吗?有什么解决方法可以帮助我实现同样的目标吗?我可以创建一个流并传递它吗?
浏览 0
提问于2019-05-23
得票数 0
1
回答
shell脚本
如何
读取批测试
文件
夹中的数据
shell
、
tensorflow
、
speech
作者提供了一个用于测试的shell脚本(clean_
wav
.sh),如下图所示: ? 这是作者提供的原始版本。根据我的测试数据路径,修改后的版本如下: ? Noisy_testset_
wav
_16k是我的测试数据
文件
夹,但是运行脚本系统会报告一个错误: ? 此
文件
夹是一个目录,但当我将路径更改为: NOISY_WAVNAME='/home/zyf/SEGAN/ SEGAN/segan-master1/noisy_testset_<em
浏览 25
提问于2019-01-17
得票数 1
回答已采纳
2
回答
你建议
使用
什么来将音频
文件
转录
成.txt?
audio
、
speech-to-text
、
google-speech-api
、
transcription
我正在做一个小型的学校项目,在这个项目中我必须获取大量的音频
文件
,并将它们
转录
成.txt
文件
。我是编程的初学者。到目前为止,我已经
使用
Google的Cloud Speech API尝试了方法。但是我不能用它来进行
批量
转录
,因为它是通过
使用
外部软件转换音频到.
wav
(这可以通过FMPEG太完成,所以没什么大不了的),并将新的.
wav
文件
分割成<60个部分,因为云语音只能
转录
<60个部分的
浏览 1
提问于2018-06-09
得票数 1
2
回答
批量
转录
和LUIS集成
microsoft-cognitive
、
azure-language-understanding
、
luis.ai
我需要在
批量
转录
和LUIS之间进行集成,其中我将把
转录
作为这样的方式传递给LUIS,并获得音频的意图。 据我所知,我们可以将用于意图分析的数据作为一个只接受500个字符的查询传递给LUIS。因此,问题来了,是否有可能将完整的从语音到文本的
转录
批量
转录
API传递给LUIS进行意图分析,或者我们必须将数据分块提供给LUIS?如果我们以块(500个字符)的形式提供数据,我们将
如何
获得音频的总体意图,因为不同的发声可能会导致不同的顶级意图。 我对此做了很多研究,阅读了微软的文档
浏览 20
提问于2020-06-11
得票数 3
1
回答
无法对Azure Cognitive Speech to text
使用
GCP签名URL
java
、
google-cloud-storage
、
speech-to-text
、
azure-cognitive-services
、
pre-signed-url
我已经在GCS存储桶上上传了一个音频
文件
,然后我
使用
以下方法为该
文件
创建了一个签名的URL: blobInfo,Storage.SignUrlOption.httpMethod(HttpMethod.GET), ); }, "
浏览 28
提问于2021-10-14
得票数 0
1
回答
如何
在UBUNTU的服务器上
如何
配置环境进行AMR
文件
的自动解压?
语音识别
、
ubuntu
问题是这样的,终端产品将压缩格式为AMR的录音
文件
通过2G移动网络发送到服务器,怎样才能在UBUNTU14.04的镜像系统中完成自动解压成
WAV
格式的语音
文件
?然后被语音识别调用?
批量
的解压,
批量
调用语音识别!
浏览 312
提问于2018-02-24
1
回答
有没有一种方法可以
使用
Azure的认知语音服务进行
批量
翻译?
azure
、
azure-cognitive-services
、
azure-speech
我希望
使用
Azure的语音到文本翻译服务,同时还可以获得语音二元化,似乎只有
批量
转录
API调用才支持二元化。https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/conversation-transcription
批量
转录
https://docs.microsoft.com/en-us/azure
浏览 12
提问于2021-05-10
得票数 0
1
回答
用java中的AudioPlayer回放24位
wav
java
、
audio
当我在java中播放24位
wav
文件
时,它们不会播放。16位
文件
正常工作。我正在
使用
:AudioStream audioStream = new AudioStream(audioInputStream);我意识到这个方法被贬低了,但是我
使用
它是出于其他原因(例如从一个jar中读取可变的
文件<
浏览 4
提问于2015-02-19
得票数 0
回答已采纳
3
回答
检测损坏的OGG
文件
java
、
corruption
、
ogg
我最近一直在转换大
批量
的WEM
文件
,从视频游戏。当我
使用
工具转换它们时,它会将它们转换成OGG
文件
。然后我
使用
Audacity将它们转换成
WAV
文件
,这样我就可以实际
使用
它了。当我在Audacity中进行
批量
转换时,它可以工作,但Audacity偶尔会冻结。这是因为Audacity正在尝试读取损坏的OGG
文件
,并崩溃。如果这些损坏的
文件
不是以数字命名的,那么清除它们并不是那么困难!(例如: 3147
浏览 1
提问于2015-04-03
得票数 1
1
回答
实现多个
文件
的Microsoft.CognitiveServices.Speech识别
java
、
microsoft-cognitive
、
azure-cognitive-services
我可以运行一个.
wav
文件
并获得记录,但是在这个例子中,程序永远不会结束,直到我按下一个键:new Scanner问题:
如何
在不需要按下键的情况下恢复/继续完全
转录
的程序? 我想运行这个多个.
wav
文件
,一个接一个
转录
。但到目前为止,它运行第一个,然后等待。我一直在浏览,我尝试过多种方法,包括
使用
recognizer.close()
浏览 1
提问于2018-10-18
得票数 0
2
回答
使用
Azure媒体服务转换将MP4转换为
WAV
文件
c#
、
azure
、
azure-media-services
我们有一个要放入MP4
文件
的blob存储。我们希望创建一个函数来监视传入的
文件
(如发布/订阅),然后
使用
azure媒体服务将
文件
编码为
wav
,并将转换后的工件保存到另一个blob存储容器中。我可以创建作业来监视传入的
文件
,我们遇到的问题是找出
如何
使用
媒体服务转换来创建
wav
文件
。我们
使用
wav
文件
将它们
转录
成文本(我们的
转录</
浏览 33
提问于2019-07-25
得票数 1
回答已采纳
1
回答
批处理转换为HTML5画布项目和发布,jsfl
html
、
flash
、
adobe
、
jsfl
我想将Flash项目
批量
转换为CreateJS项目并发布它们。
如何
编写jsfl来批处理运行内置的html5转换jsfl脚本(在“命令”菜单中可以访问)和
批量
发布?我不知道
如何
使用
这个: 我稍微修改了声音导出脚本,以递归地创建
文件
夹:
浏览 2
提问于2015-10-23
得票数 0
回答已采纳
3
回答
用CPU和GPU训练模型速度和内存
performance
、
tensorflow
、
cpu
、
ram
我正在尝试
使用
通过生成的数据集(大约340000个带有
转录
本的小
wav
音频样本)来训练在中发现的模型。当我
使用
CPU进行训练时,训练要慢得多,但我可以轻松地将batch_train_size设置为250 (可能高达700,但尚未尝试)。我搞不懂GPU上的小
批量
限制会
如何
影响培训质量,或者如果提高批次数量可能会抵消这种影响… 也就是说,10000年代有25个样品,500个年代有500个?
浏览 2
提问于2017-05-03
得票数 2
回答已采纳
1
回答
带有音频url的azure语音到文本
javascript
、
azure
、
botframework
、
speech-to-text
、
azure-cognitive-services
嗨,我试过用音频
文件
来发短信,
使用
蓝色的语音文字,一切都正常工作。有人能指点我
如何
用音频url在蔚蓝中做讲稿吗?我正在
使用
REST。
浏览 4
提问于2022-10-06
得票数 0
回答已采纳
1
回答
使用
sox
批量
修剪
wav
文件
batch-file
我正在尝试
使用
sox来批次修剪音频
文件
(
wav
),修剪前15秒。当我在单个
文件
上运行以下操作时,它会在同一个
文件
夹中创建一个
文件
'snipped.
wav
‘减去前15秒cd E:\trim\singlefile但是,当我在多个
文件
上尝试以下操作时(处理后的
文件
应该移动到“微调”
文件</em
浏览 3
提问于2016-11-25
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
使用Python批量修改文件名
办公小能手,使用Python批量修改文件名!
使用Python批量修改PPTX文件中文本框格式
Python 批量修改文件名
Python批量转换ppt文件为pptx文件
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券