如何使用python批量/批量转录wav文件？_python批量读取文件_python批量打印文件 - 腾讯云开发者社区

、、、、

我正在尝试使用我的python应用程序来转录文件夹中的多个文件，并加快这一过程。inplace=True) test4.to_csv("Call 8.csv") 我如何才能转录文件夹中的多个文件，而不是一次转录一个文件?我可以多次运行此脚本，但我希望将其自动化，以便它从文件夹中

浏览 76提问于2021-03-03得票数 6

回答已采纳

1回答

如何在Azure中进行语音识别并立即完成

、、、

我使用this example from Azure -连续识别。但是，我需要等待很长时间才能完成识别，例如1小时的语音文件。有没有可能让Azure立即完成识别？目前，识别率约为1:1，即识别1小时的文件需要1小时。我希望这件事能在1:60完成。

浏览 126提问于2021-11-04得票数 1

1回答

谷歌语音到文本不能正常工作与很短的音频(单个词)

、、、

我正在测试和流媒体音频以及wav文件。我使用来自电话的音频: 8000采样率，8位，混音编码。Google配置是适当设置的。有人知道为什么会这样吗？怎么修呢？

浏览 6提问于2021-12-28得票数 1

回答已采纳

1回答

期望的音频采样率与实际不匹配？

、、、、

我正在尝试使用袖珍狮身人面像转录音频文件。下面是我需要转录的一个音频文件：$ soxi 116-288045-0000.flac.wav Input File : '116-288045-0000.flac.wav'，我做了一些预处理

浏览 1提问于2017-10-19得票数 0

2回答

如何将一个文件扩展名的文件与一个不同扩展名的不同文件互换，并保持目录结构？

、

我从事音频工作，我需要一些由第三方转录的文件。为此，我必须用我压缩的.mp3s换出.wav文件的整个目录，同时保持文件目录不变。大约有20,000个文件。例如：Folder1 sound1.wav Folder 1b sound4.wavFolder2

浏览 0提问于2018-05-19得票数 0

1回答

如何使用OneDrive存储音频文件，而不是使用Azure Blob进行批量语音转录？

、、

我想通过OneDrive使用Azure认知服务语音，而不是使用Azure blob存储位置。这个是可能的吗？有什么解决方法可以帮助我实现同样的目标吗？我可以创建一个流并传递它吗？

浏览 0提问于2019-05-23得票数 0

1回答

作者提供了一个用于测试的shell脚本(clean_wav.sh)，如下图所示： ? 这是作者提供的原始版本。根据我的测试数据路径，修改后的版本如下： ? Noisy_testset_wav_16k是我的测试数据文件夹，但是运行脚本系统会报告一个错误： ? 此文件夹是一个目录，但当我将路径更改为： NOISY_WAVNAME='/home/zyf/SEGAN/ SEGAN/segan-master1/noisy_testset_<em

浏览 25提问于2019-01-17得票数 1

回答已采纳

2回答

你建议使用什么来将音频文件转录成.txt？

、、、

我正在做一个小型的学校项目，在这个项目中我必须获取大量的音频文件，并将它们转录成.txt文件。我是编程的初学者。到目前为止，我已经使用Google的Cloud Speech API尝试了方法。但是我不能用它来进行批量转录，因为它是通过使用外部软件转换音频到.wav (这可以通过FMPEG太完成，所以没什么大不了的)，并将新的.wav文件分割成<60个部分，因为云语音只能转录<60个部分的

浏览 1提问于2018-06-09得票数 1

2回答

批量转录和LUIS集成

、、

我需要在批量转录和LUIS之间进行集成，其中我将把转录作为这样的方式传递给LUIS，并获得音频的意图。据我所知，我们可以将用于意图分析的数据作为一个只接受500个字符的查询传递给LUIS。因此，问题来了，是否有可能将完整的从语音到文本的转录批量转录API传递给LUIS进行意图分析，或者我们必须将数据分块提供给LUIS？如果我们以块(500个字符)的形式提供数据，我们将如何获得音频的总体意图，因为不同的发声可能会导致不同的顶级意图。我对此做了很多研究，阅读了微软的文档

浏览 20提问于2020-06-11得票数 3

1回答

无法对Azure Cognitive Speech to text使用GCP签名URL

、、、、

我已经在GCS存储桶上上传了一个音频文件，然后我使用以下方法为该文件创建了一个签名的URL： blobInfo,Storage.SignUrlOption.httpMethod(HttpMethod.GET), ); }, "

浏览 28提问于2021-10-14得票数 0

1回答

如何在UBUNTU的服务器上如何配置环境进行AMR文件的自动解压？

、

问题是这样的，终端产品将压缩格式为AMR的录音文件通过2G移动网络发送到服务器，怎样才能在UBUNTU14.04的镜像系统中完成自动解压成WAV格式的语音文件？然后被语音识别调用？批量的解压，批量调用语音识别！

浏览 321提问于2018-02-24

1回答

有没有一种方法可以使用Azure的认知语音服务进行批量翻译？

、、

我希望使用Azure的语音到文本翻译服务，同时还可以获得语音二元化，似乎只有批量转录API调用才支持二元化。https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/conversation-transcription 批量转录https://docs.microsoft.com/en-us/azure

浏览 12提问于2021-05-10得票数 0

1回答

用java中的AudioPlayer回放24位wav

、

当我在java中播放24位wav文件时，它们不会播放。16位文件正常工作。我正在使用：AudioStream audioStream = new AudioStream(audioInputStream);我意识到这个方法被贬低了，但是我使用它是出于其他原因(例如从一个jar中读取可变的文件<

浏览 4提问于2015-02-19得票数 0

回答已采纳

3回答

检测损坏的OGG文件

、、

我最近一直在转换大批量的WEM文件，从视频游戏。当我使用工具转换它们时，它会将它们转换成OGG文件。然后我使用Audacity将它们转换成WAV文件，这样我就可以实际使用它了。当我在Audacity中进行批量转换时，它可以工作，但Audacity偶尔会冻结。这是因为Audacity正在尝试读取损坏的OGG文件，并崩溃。如果这些损坏的文件不是以数字命名的，那么清除它们并不是那么困难！(例如: 3147

浏览 1提问于2015-04-03得票数 1

1回答

实现多个文件的Microsoft.CognitiveServices.Speech识别

、、

我可以运行一个.wav文件并获得记录，但是在这个例子中，程序永远不会结束，直到我按下一个键：new Scanner问题：如何在不需要按下键的情况下恢复/继续完全转录的程序？我想运行这个多个.wav文件，一个接一个转录。但到目前为止，它运行第一个，然后等待。我一直在浏览，我尝试过多种方法，包括使用recognizer.close()

浏览 1提问于2018-10-18得票数 0

2回答

使用Azure媒体服务转换将MP4转换为WAV文件

、、

我们有一个要放入MP4文件的blob存储。我们希望创建一个函数来监视传入的文件(如发布/订阅)，然后使用azure媒体服务将文件编码为wav，并将转换后的工件保存到另一个blob存储容器中。我可以创建作业来监视传入的文件，我们遇到的问题是找出如何使用媒体服务转换来创建wav文件。我们使用wav文件将它们转录成文本(我们的转录</

浏览 33提问于2019-07-25得票数 1

回答已采纳

1回答

批处理转换为HTML5画布项目和发布，jsfl

、、、

我想将Flash项目批量转换为CreateJS项目并发布它们。如何编写jsfl来批处理运行内置的html5转换jsfl脚本(在“命令”菜单中可以访问)和批量发布？我不知道如何使用这个：我稍微修改了声音导出脚本，以递归地创建文件夹：

浏览 2提问于2015-10-23得票数 0

回答已采纳

3回答

用CPU和GPU训练模型速度和内存

、、、

我正在尝试使用通过生成的数据集(大约340000个带有转录本的小wav音频样本)来训练在中发现的模型。当我使用CPU进行训练时，训练要慢得多，但我可以轻松地将batch_train_size设置为250 (可能高达700，但尚未尝试)。我搞不懂GPU上的小批量限制会如何影响培训质量，或者如果提高批次数量可能会抵消这种影响… 也就是说，10000年代有25个样品，500个年代有500个？

浏览 2提问于2017-05-03得票数 2

回答已采纳

1回答

带有音频url的azure语音到文本

、、、、

嗨，我试过用音频文件来发短信，使用蓝色的语音文字，一切都正常工作。有人能指点我如何用音频url在蔚蓝中做讲稿吗？我正在使用REST。

浏览 4提问于2022-10-06得票数 0

回答已采纳

1回答

使用sox批量修剪wav文件

我正在尝试使用sox来批次修剪音频文件(wav)，修剪前15秒。当我在单个文件上运行以下操作时，它会在同一个文件夹中创建一个文件'snipped.wav‘减去前15秒cd E:\trim\singlefile但是，当我在多个文件上尝试以下操作时(处理后的文件应该移动到“微调”文件</em

浏览 3提问于2016-11-25得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云