如何将音频帧附加到wav文件python_在Python中混合/覆盖wav音频文件_使用Python语言更新/附加到.wav文件 - 腾讯云开发者社区

python、wav

python中用于读取WAV文件的函数readframe(N)以字节字符串的形式读取和返回最多n帧的音频。python中有没有一个函数可以返回WAV文件的第k帧？

浏览 2提问于2016-02-22得票数 0

2回答

如何在Tensorflow中解析音频文件

python、parsing、tensorflow

我是Python的新手，我想训练一个音频模型。我把我的音频文件转换成.wav格式。如何将这些音频.wav文件解析为tensorflow

浏览 1提问于2019-01-07得票数 0

1回答

从.wav文件中提取扰动

python、audio、signal-processing、pcm、noise-reduction

我有两个.wav文件，一个包含原始音频(original.wav)，另一个包含由音频对抗性示例攻击代码生成的扰动(attacked.wav)。如何将微扰提取为一个单独的perturbation.wav文件，将original.wav文件与attacked.wav进行比较，最好使用python3

浏览 0提问于2019-12-19得票数 1

回答已采纳

2回答

我正在尝试使用python脚本转换一些音频文件。源文件夹包含.wav和.aiff音频文件，具有不同的比特率和采样率。输入文件示例我需要将所有音频文件转换为单16位44.1khz .wav 输出文件示例目前，我成功地使用库打开并将.wav文件写入/转换为PCM_16类型。我不知道如何将.aiff文件转换为.wav文件。我知道Python使用.aiff库处理aifc文件，但它似乎不包含任何类型的转换功能。我怎么能这么做？

浏览 8提问于2016-12-18得票数 1

1回答

使用Python语言更新/附加到.wav文件

python、audio、udp、wav、pcm

我有一个PCM音频帧流进入我的Python脚本，我能够将这些帧的块保存为.wav文件： def update_wav(): filename = "test.wav" wav_file = wave.open(filename, "wb") n_frames = len(audio) wav_file.setparams((n_channels, sample_width, sample_rate, n_frames, comptype, compname)) for sample in audio:

浏览 10提问于2019-03-01得票数 1

回答已采纳

1回答

如何将音频帧附加到wav文件python

python、wav、pyaudio、pcm

我有一个PCM音频帧流到我的python代码.Is中，有一种方法来编写帧的方式，附加到现有的.wav文件。我试过的是我正在拍摄2个wav文件。从1个wav文件中读取数据并写入现有的wav文件 import numpy import wave import scipy.io.wavfile with open('testing_data.wav', 'rb') as fd: contents = fd.read() contents1=bytearray(contents) numpy_data = numpy.array(contents1, dtype

浏览 57提问于2021-01-29得票数 0

1回答

从原始wav音频中获取信号的正、负分量

python、audio、signal-processing

我正在读这篇StackOverflow帖子：根据答案，数字信号将具有一个+ve分量和一个负分量。所以我试着把它和一个非常基本的wav音频文件联系起来。我正在使用python读取一个WAV音频文件的所有帧。我使用以下代码： import wave import sys ip = wave.open(sys.argv[1], 'r') print ip.getparams() for i in range(ip.getnframes()): iframe = ip.readframes(1) print iframe.encode('hex')

浏览 2提问于2014-04-01得票数 0

1回答

如何使用C#编辑wave音频文件？

c#、audio、edit、wav

我想做一个可以处理音频的程序。当每个帧都有音量的音调数组时，如何获得帧的数组？(这是音频的构造方式。) 基本上，它只是一个解析WAV文件和导出WAV文件的应用程序接口。也许有一种不同的音频编辑方式？

浏览 1提问于2011-11-19得票数 1

回答已采纳

2回答

增加/降低WAV文件Python的播放速度

python、audio、signal-processing、wav

我想改变某个WAV音频文件的播放速度(增减)使用python波形模块。我试过以下的方法：读取输入文件的帧速率。把帧率翻一番。使用output_wave.setparams()函数编写一个新的增加帧速率的波形文件。但这不管用。请建议一下。提前谢谢，

浏览 7提问于2014-03-31得票数 5

回答已采纳

1回答

从另一个WAV文件写入wav文件的问题

java、audio、fileoutputstream、random-access

在我的程序中，我必须从视频和音频中删除某些帧，以便删除广告。视频存储在.rgb文件中，音频存储在.wav文件中。视频工作正常。但是，当我尝试将一个wav文件中的几个帧写入输出wav文件时，它在播放时出现错误。虽然程序编写正确，我可以在Real Player中播放它，但当我在与教授给出的播放wav文件的代码相同的代码上运行它时，音频给出了一个名为标记/重置不受支持和无法获得位置错误的错误。我找不到写音频函数的错误。下面是函数 public void do_audioWrite() throws IOException { long offset=0; long offset

浏览 17提问于2013-04-23得票数 0

回答已采纳

2回答

如何将文本转换为音频文件，并通过python/django在浏览器中播放？

python、django、django-views、text-to-speech

如何将文本转换成可以在浏览器中通过python/django视图播放的音频文件？如何在python中进行文本到语音的转换？我想将一个字符串转换成一个.wav文件，它将通过python/django视图在浏览器中播放。例如： text = "how are you?" convert text to audio file (text.wav) open text.wav file & play in browser via django view.

浏览 0提问于2012-09-28得票数 2

2回答

精确对齐两个wav文件

matlab、audio、wav、waveform

我有一个工具，比较两个音频wav文件逐帧，并返回一个等级，给出两个文件之间的相似性水平。我有一个原始的wav文件和一个wav文件的录音，因为这两个文件几乎相似，我应该得到一个很高的相似性分数，但我得到一个很差的分数，主要是由于录制的文件中有一个非常轻微的延迟-导致帧不匹配我的问题是-如何使用MATLAB准确地对齐两个音频文件，以便可以进行有效的帧到帧比较。

浏览 2提问于2011-11-22得票数 1

回答已采纳

1回答

在ios中使用进度条将.caf文件转换为.wav文件

iphone、audio、avfoundation、wav、caf

我以.caf格式录制音频，之后需要将其转换为.wav，以便将文件上传为dropbox。如何将文件转换为iOS格式的wav格式？我不想直接录制音频.wav格式如何将.CAF转换为.WAV文件虽然转换需要更多的时间，但我需要实现转换进度条。

浏览 4提问于2013-10-01得票数 2

回答已采纳

1回答

使用python计算fft

python、raspberry-pi、sox、pydub、libsox

通过在Python语言中使用wave，我们可以读取.wav音频格式，并可以计算出信号的频率和功率。但是我想直接计算.mp3音频格式的频率。我听说过一些关于Pysox的事情。Pysox能够读取帧吗?我们可以使用Pysox计算fft和频率吗？或者，有没有其他软件可以使用Python计算MP3文件的频率？

浏览 4提问于2015-06-17得票数 4

1回答

张量流STFT函数的正确使用

audio、tensorflow

我正在尝试构建一个音频样本的图谱，类似于使用Audacity创建的音频样本。从Audacity的wiki页面，情节谱(附例)执行：图谱取音频块的“大小”样本，做FFT，并平均所有的块在一起。我正在考虑使用Tensorflow最近提供的STFT功能。我使用的是512大小的音频块，代码如下： audio_binary = tf.read_file(audio_file) waveform = tf.contrib.ffmpeg.decode_audio( audio_binary, file_format="wav", samples

浏览 13提问于2017-08-27得票数 5

2回答

CSound和Python通信

python、audio、evolutionary-algorithm、csound

我目前正在做一个关于用进化算法模拟吉他效果的专业化项目，我想使用Python和CSound来做这件事。这个想法是在我的Python语言算法中生成效果参数，将它们发送到CSound，并将过滤器应用于音频文件，然后将新的音频文件发送回Python进行频率分析，以便与目标音频文件进行比较(这将在循环中完成，直到音频文件与目标音频文件足够相似，所以CSound和Python之间的发送/接收将会做很多工作)。简而言之，如何让Python将数据发送到CSound(.csd文件)，如何读取.csd文件中的数据，以及如何将.wav文件从CSound发送到Python？还优选的是，这可以自己动态地工作，直到

浏览 10提问于2011-11-21得票数 5

1回答

使用FFMPEG输出填补空白的音频

audio、ffmpeg

我有一个MKV文件与空白的音频。也就是说，在MKV音频跟踪时间戳中存在空白。根据"ffmpeg"，AC3音频长度为802秒，但当将音频导出到WAV时，产生的文件长度为801'53秒。也就是说，“导出”音频更短。将问题与 ffmpeg -i INPUT.mkv -af ashowinfo -map 0:2 -y -frames:a XXXX -f alaw /dev/null 我可以确认长度差异与原始音频帧时间戳中的间隙是一致的。有几个缺少音频帧。我想这些都被玩家的沉默所取代了。用于导出音频的命令是： ffmpeg -i INPUT.mkv -map 0:1 -ac

浏览 1提问于2018-10-16得票数 1

回答已采纳

1回答

如何在不保存到文件的情况下收听IBM Watson Text to Speech结果(python)

python、ibm-cloud、text-to-speech、ibm-watson、watson-text-to-speech

我正在编写一个简单的python程序，该程序获取一个文本文件，然后使用IBM Watson text To Speech将其转换为音频，然后使用playsound等模块直接播放音频。大多数教程只向您展示了如何将结果保存到文件中，而不是如何将其传递给播放音频的模块 from ibm_watson import TextToSpeechV1 from ibm_cloud_sdk_core.authenticators import IAMAuthenticator authenticator = IAMAuthenticator('{apikey}') text_to_spe

浏览 47提问于2019-12-18得票数 1

回答已采纳

1回答

如何将语音转换为python - opus文件格式的文本

python、nlp、speech-to-text、speech、opus

我有一些.opus音频文件，需要转换为文本，以运行一些分析。我知道，有一个Python包可以用文件来实现这一点，就像在中演示的那样。是否有人知道如何将.opus文件转换为文本，或如何将.opus转换为.wav？我尝试过Python包，但没有成功。

浏览 15提问于2022-11-11得票数 1

回答已采纳

3回答

如何安装..cue/..wav

mount、flac、wav、abcde

我有一个指向.cue的.flac文件我如何将图像挂载，就好像它是一张音频CD？是否有必要将.flac文件解码为.wav并编辑提示表以指向.wav文件(它当前指向flac)？我想使用abcde对音频进行拆分、标记和编码。我在这里找到的答案已经讨论过了。.cue/..bin组合体，而不是音频图像。

浏览 0提问于2012-09-03得票数 5

回答已采纳

1回答

改变mov或wav的WAV、aiff或MOV音频采样率而不改变采样数

ffmpeg、wav、quicktime、sox、aiff

我需要一个非常精确的方式来加速音频。我正在为OpenDCP准备电影，这是一个制作数字影院包的开源工具，用于在影院放映。我的源文件通常是23.976fps和48.000 MOV音频的quicktime MOV文件。有时我的音频是一个单独的48.000 WAV的WAV。(FWIW，源的视频帧率实际上是24/100.1帧/秒，这是一个重复的小数。) DCP标准基于24.000fps和48.000 The的节目，因此需要加速源的音频和视频。图像处理工作流程本质上涉及将MOV转换为TIF序列，即每帧帧，然后假定为24.000fps，因此我不必涉及QT Video Media Handler的内部。但事

浏览 2提问于2013-03-06得票数 0

回答已采纳

2回答

JAudio要素提取器不提取特定文件的要素

audio

我正在使用jAudio软件进行音频文件的特征提取。我正在使用aiff，au，wav等文件格式的文件。它提取文件的特征与帧速率为16000帧每秒，通道:立体声，帧大小:16位等。虽然我有转换器转换文件为wav，au，aiff格式，但我没有任何转换器，要求我在转换时的帧率等。因此，我的文件具有更高的特征值，并且在转换时会出现错误。亲切的指南是这个软件错误或歌曲应该转换在这个帧速率等只。请还建议一个软件，转换音频文件格式，要求这些特征值，同时转换。

浏览 0提问于2011-03-29得票数 0

1回答

如何将大量音频文件与NAudio混合？

c#、naudio、mixing

例如，我有5个音频文件。而且，我想将这些文件与C# NAudio结合起来。 <------- A.wav -------> <---- B.wav ----> <---- C.wav ----> <-- D.wav --> <- E.wav -> 我目不转睛，但我能找到一个适用于这种情况的解决办法。 <----- A.wav -----> <-- B.wav --> <------ C.wav ------> 如何将许多音频文件与每个长度和位置结合起来？

浏览 2提问于2022-06-03得票数 0

回答已采纳

1回答

在Matlab中根据视频帧率对.wav文件进行分割

matlab、video、wav、video-processing、yuv

我有一个yuv视频(比如stream.yuv)和相应的音频文件(stream.wav)。现在我有了图形用户界面，它可以在逐帧的基础上渲染原始视频。我目前面临的问题是，我需要播放与每个视频帧关联的音频。我一开始就尝试了下面的方法，但是当我执行这个命令时，音频声音就会断掉 %% Dividing the audio into per-second samples nframes = 720; [audioFile, audioSampleFreq] = audioread('stream.wav'); numSamples = length(audioFile); audioL

浏览 0提问于2015-11-28得票数 0

2回答

如何使用SoX更改比特率

sox、libsox

我试图更改给定音频文件的比特率，下面的代码使用1411 kbps生成音频 sox -t wav input.wav -C 320 output.wav speed 0.86 reverb 52 50 100 100 0 0; 有人能引导我如何将音频比特率改为320 guide吗？

浏览 7提问于2021-04-03得票数 0

回答已采纳

1回答

什么是.wav文件格式的频道?播放wav文件时是否同时播放所有频道？

audio、wav、channel、bit-depth

我通过谷歌阅读about.wav文件格式，我所能想到的是帧是由样本(定义的位深度)组成的，并且wav立体声文件具有多个称为通道的东西……令人困惑的是通道是否由帧组成？当我播放一些音频文件时，所有的频道都会播放吗？如果通道是由帧组成的，那么所有通道的长度是否相等(按位)？请回答如果有人可以，我必须单独显示每个频道时，播放波形中的wav文件

浏览 5提问于2012-12-22得票数 16

回答已采纳

1回答

如何将直播流WAV格式的音频数据馈送到html5音频标签

javascript、node.js、audio、websocket、live-streaming

如何将直播流音频数据传入html5音频标签。我从nodejs服务器接收到通过web套接字格式化的连续音频数据块wav。直播情况下，如何将这些数据反馈到音频标签中。在我的简单html文件中，我有如下音频标记： <audio id="audiowav" type="audio/wav" controls autoplay></audio> 下面是我的javascript文件中使用的一组代码： var socket = new WebSocket('ws://localhost:port'); socket.onmess

浏览 1提问于2018-05-24得票数 0

1回答

二进制字符串到音频转换(Python或Java)

java、python、audio、binary

我有一串二进制文件。我需要把这个转换成wav文件。是否有任何现有的库来实现这一目标？如果是这样，我将如何将字节写入音频文件最好是Java或Python，但任何语言都能工作。

浏览 8提问于2016-01-06得票数 0

1回答

自动更改parser.add参数值

python-3.x、argparse

我有一个python脚本，它接受两个参数，一个是音频文件路径，另一个是模型路径。此脚本用于对音频文件进行去噪。我有多个音频文件。如何在--file_name参数中自动更改音频文件的路径，例如，在运行此文件后执行第二个文件 python test_audio.py --file_name p232_160.wav --epoch_name generator-80.pkl python test_audio.py --file_name p232_161.wav --epoch_name generator-80.pkl python test_audio.py --file_name p23

浏览 5提问于2021-05-17得票数 0

1回答

如何创建和培训带有音频输入的tensorflow模型？

tensorflow、neural-network、audio-processing

我有音频文件，比如"left.wav"，"right.wav“等等，我想要创建一个模型，它将音频作为输入和输出标签”左“或”右“等等。问题如何将原始音频输入到神经网络中？

浏览 1提问于2018-04-16得票数 0

回答已采纳

1回答

利用matlab进行谱图处理后提取FFT帧的局部极大值

matlab、audio、signal-processing、spectrogram

用谱图处理信号后，从FFT帧中提取局部极大值。具体来说，我有一个音频文件，它是一个wav文件，它是按照以下步骤收集的：手机用户将智能手机保持在大约手臂的距离上，吸入他们的整个肺容量，并用力呼气，直到整个肺容积被排出。手机的麦克风记录呼出并将数据存储在wav文件中。然后，我使用以下程序用谱图处理音频：首先，我将音频缓冲为30 50帧(帧间重叠50% )。然后用hamming窗口对每个帧进行加窗，并取|FFT|db生成信号的幅度谱图。下面是我如何使用matlab实现的： [X, FS] = audioread('Rec_002.wav'); info = audioi

浏览 2提问于2016-11-21得票数 1

回答已采纳

1回答

在Python中合并音频文件

python、audio

如何在Python中将多个音频文件(wav)组合成一个文件？我发现了这个： import wave infiles = ["sound_1.wav", "sound_2.wav"] outfile = "sounds.wav" data= [] for infile in infiles: w = wave.open(infile, 'rb') data.append( [w.getparams(), w.readframes(w.getnframes())] ) w.close() output =

浏览 4提问于2020-04-29得票数 7

回答已采纳

1回答

无法打开文件'audioAnalysis.py'：[Errno 2]没有这样的文件或目录

python、pyaudioanalysis

我试图将MFCC的音频文件存储到csv文件中。我正在跟踪，使用进行特征提取。建议的命令是： python3 audioAnalysis.py featureExtractionFile -i test.wav -mw 1.0 -ms 1.0 -sw 0.050 -ss 0.050 -o data/speech_music_sample.wav 我在使用这个命令时做了一些小改动，也就是说，我在命令中使用python，因为我的PC上只安装了python-3。我收到一个错误： C:\Users\myusername\AppData\Local\Programs\Python\Python37\p

浏览 7提问于2020-07-18得票数 1

1回答

如何准备与Scipy.Correlate进行相互关联的.WAV文件以实现到达时间延迟

python、audio、signal-processing、wav

我同时录制了两个.wav音频文件(用于生物声学试验研究的室外麦克风)。一只飞过的鸟在鸣叫，两个麦克风都能探测到鸟，但在不同的时间点。一个常见的任务是将两个信号互相关并找到峰值互相关值，该峰值互相关值表示到达一个麦克风的信号与另一个麦克风之间的时间延迟。我在这里找到了执行此操作的代码Find time shift of two signals using cross correlation 然而，这篇文章似乎假设人们知道如何将他们的音频文件转换为对此分析有用的格式。基本尝试只使用我的整个wav文件作为y1和y2失败，因为数据不是正确的格式 TypeError: ufunc 'mult

浏览 27提问于2020-04-30得票数 0

1回答

如何在android中将wav音频文件转换为十六进制值？

android、hex、wav、audio-recording、bluetooth-lowenergy

我正在录制和保存wav格式的音频。我想将该音频文件转换为十六进制值，以便发送到蓝牙低能耗设备。如何将我的.wav文件转换成十六进制？我想打印我的音频文件的相应十六进制值。我该怎么做呢？

浏览 0提问于2016-02-09得票数 0

1回答

使用w4a格式音频(Node.js)

node.js、ibm-cloud、speech-to-text、ibm-watson

我试着用将音频转录成文字脚本。 request({ uri: attachment.url, method: 'GET', encoding: null }, (err, res, audio) => {... do something...} 我使用请求从我在消息中获得的url获取音频文件。但是我只能得到w4a文件，沃森只支持音频/火焰音频/wav 音频/L16 音频/ogg 如何将w4a格式的音频转换为wav以适应规范。还是有其他方法可以做到？谢谢。

浏览 1提问于2016-05-23得票数 0

1回答

当我重建音频文件时，我如何编码和分割音频文件而不存在片段之间的空白(或音频弹出)？

html、node.js、ffmpeg、audio-streaming、web-audio-api

我正在开发一个web应用程序，它需要多个音频文件的流和同步。为此，我使用 over HTML5音频标记，因为定时音频的重要性。目前，我正在使用FFMPEG的分段功能来编码和分割音频文件为较小的块。我之所以分割它们，是因为我可以从文件的中间开始流，而不是从一开始就开始(否则我只会使用UNIX，来分割文件。问题是，当我将音频片段串回一起时，我会在片段之间得到一个音频弹出。如果我使用PCM编码(pcm_s24le)在.wav文件中编码，则回放是无缝的，这使我相信编码器正在填充文件的开始或结束。由于我将处理许多不同的音频文件，使用.wav将需要太多的带宽。我正在寻找解决这个问题的下列方案之一：

浏览 6提问于2013-02-13得票数 9

2回答

从mp3文件访问采样率(Hz)和音频信号的pydub

python、audio、mp3、wav、pydub

刚刚发现这个有趣的python包pydub，它将任何音频文件转换为mp3、wav等。据我所读到的文件，这一过程如下：使用mp3 ()读取from_mp3音频文件使用export()创建wav文件。只是好奇是否有一种方法可以直接从mp3文件访问采样率和音频信号(假设它是一维数组)，而不将其转换为wav文件。我正在处理数千个音频文件，将它们全部转换为wav文件可能会很昂贵。

浏览 1提问于2015-07-14得票数 5

回答已采纳

1回答

使用Python从twilio媒体流中解析音频

python、audio、stream、twilio、media

我使用Twilio流向本地服务器传送呼叫音频。作为参考，我借鉴了来自Twilio团队的官方。解码音频并将其保存到.wav文件中是有效的，尽管当播放音频时有些不舒服(使用压缩技巧的“慢动作”)。你可以在上听它。与来自twilio控制台的进行相同的调用相比，存在着明显的差异。现在，我想让流中的音频听起来像理想的一样好，因为我需要将它输入自定义的ML模型。当使用以下代码比较上述音频文件时： import pywav wave_read = pywav.WavRead("filename.wav") print(wave_read.getparams()) 我们得到： Twilio

浏览 13提问于2022-08-19得票数 0

回答已采纳

1回答

播放Python中特定位置的声音

python、audio

目标在用户启动应用程序时，从位置D:1.wav播放wav文件研究看到了以下问题：我试过什么我试过以下几句：示例1 import winsound winsound.PlaySound('D:\1.wav',winsound.SND_FILENAME) ##Did not work 示例2 import winsound winsound.PlaySound('1.wav',winsound.SND_FILENAME) ##DID not work 两次我都得到了默认的声音，而不是应该按照音频文件播放的声音。也是当我编写winsound

浏览 13提问于2013-04-05得票数 3

回答已采纳

2回答

如何在python3中将24位wav文件转换为16位或32位文件

python、audio、wav

我正在尝试制作一堆.wav文件的频谱图，这样我就可以进一步分析它们(在Python3.6中)，然而，我一直收到这个讨厌的错误 ValueError: Unsupported bit depth: the wav file has 24-bit data. 我已经研究了其他堆栈溢出帖子，比如，但是这些帖子并没有解决这个问题！我找到了一个名为Pysoundfile的音频库我把它安装在 pip3 install pysoundfile 我已经看过了文档，但我仍然不清楚如何将24位的.wav文件转换为32位的wav文件或16位的wav文件，以便我可以从它创建频谱图。任何帮助都将不胜感激！

浏览 1提问于2017-06-29得票数 5

回答已采纳

1回答

来自音频流wav或mp3的python make_chunks

python、audio、streaming、wav、chunks

我想写一个python程序，可以从音频文件中写块。我可以使用以下代码从本地可用的音频文件中编写块， from pydub import AudioSegment from pydub.utils import make_chunks myaudio = AudioSegment.from_file("file1.wav" , "wav") chunk_length_ms = 10000 # pydub calculates in millisec chunks = make_chunks(myaudio, chunk_length_ms) #Make ch

浏览 48提问于2018-12-31得票数 3

1回答

如何将音频帧转换成wav格式而不写入文件？

python、audio、wav、pyaudio

我想要实现简单的语音到文本工具，使用py音频和implement服务。目前，我需要录制音频，保存到磁盘，然后再加载，以便将其发送到Bluemix。 RATE=44100 RECORD_SECONDS = 10 CHUNKSIZE = 1024 # initialize portaudio p = pyaudio.PyAudio() stream = p.open(format=pyaudio.paInt16, channels=1, rate=RATE, input=True, frames_per_buffer=CHUNKSIZE) frames = [] # A python-

浏览 5提问于2017-09-23得票数 8

2回答

读取python中的WAV文件

python、wav、unpack、steganography

import wave,struct f = wave.open('bird.wav', 'r') for i in range(5,10): frame = f.readframes(i) print frame struct.unpack('<H',frame) 我使用上述代码从python中的立体声wav文件中提取字节。然而，我得到的不是字节，而是一些乱七八糟的字符。使用struct.unpack()函数，我得到以下错误 “解包需要长度为2的字符串参数” 我在代码中做了哪些修改来打印1和0中的字节呢？我想在以

浏览 17提问于2016-02-20得票数 2

回答已采纳

1回答

librosa ParameterError:音频缓冲区并非处处都是有限的(切割wav文件)

python、wav、librosa

我正在培训一个名为DeWave ()的Python音频源分离模型包。它是关于单通道.wav文件的训练。在对模型进行培训之后，我对一个.wav示例进行了推断(将单声道音频测试文件中的两个扬声器源分离开来)。这很好，除了之外，如果我剪切了.wav文件，在这种情况下，我会从librosa那里得到一个错误，说明音频缓冲区并非处处都是有限的。我试图对不同的音频文件进行推断，只有使用外部软件来剪切.wav文件时才会发生错误(我尝试过用sox和Zamzar进行裁剪)。我成功地推断出的音频文件都有不同的长度，并且不是给定长度的倍数，所以我不认为这是长度问题。我想知道文件切割是否会擦除缓冲区，但我对缓冲区不太

浏览 2提问于2019-07-18得票数 1

回答已采纳

1回答

如何利用pyAudioAnalysis提取每个视频帧的音频特征

python、feature-extraction、audio-recognition

我正在尝试为每个视频帧提取音频特征。我知道视频文件中有30个视频帧和16000个音频帧每秒。我正在使用pyAudioAnalysis python来实现这个目标，但没有成功。这是我的密码。 from __future__ import print_function from pyAudioAnalysis import audioBasicIO from pyAudioAnalysis import ShortTermFeatures,MidTermFeatures import matplotlib.pyplot as plt import os,shlex, subprocess impo

浏览 0提问于2020-08-24得票数 0

2回答

谷歌语音转文本应用程序接口，InvalidArgument: 400必须使用单通道(单声道)

python、google-cloud-speech

我在google Speech- to -text中不断得到这个错误的InvalidArgument: 400，问题似乎是我正在使用一个2声道的音频(立体声)，而API正在等待一个wav in (单声道)。如果我在音频编辑器中转换文件，它可能会工作，但我不能使用音频编辑器来转换一批文件。有没有办法在Python或Google Cloud中更改音频类型。注意:我已经尝试了"wave module“，但我一直收到一个错误#7，文件类型无法识别(我无法从Python中读取wave模块的wav文件) -错误- InvalidArgument: 400必须使用单声道(单声道)音频，但WAV

浏览 131提问于2019-03-12得票数 12

2回答

OpenAL只使用caff格式的音频文件吗？

ios、xcode、audio、openal

我正在制作一个带有音效的游戏，使用的是打开al和.wav格式的音频文件，但是这不会在iOS上播放任何sound.Does打开的al，只允许运行iOS文件，如果是这样，我如何将wav音频文件转换成caff？

浏览 4提问于2014-10-16得票数 2

回答已采纳

1回答

将通过AUFilePlayer播放的音频保存到外部文件

iphone、ios、ipad、core-audio

在我的iOS应用程序中，我正在播放一些短波文件，并最终尝试将我播放的所有内容导出为单个音频文件，如WAV或CAF文件。我已经设法用AUFilePlayer做了回放。如何将通过AUFilePlayer播放的音频保存为WAV或CAF文件？

浏览 2提问于2012-10-08得票数 0

回答已采纳

1回答

用Node.js从AudioBuffer写入wav文件

javascript、node.js、audiocontext

我是Node.js编程的新手，我正在尝试将一个m4a文件转换为wav文件。我使用了音频缓冲到wav和网络音频api.这是我的密码： const fs = require('fs'); const toWav = require('audiobuffer-to-wav'); const AudioContext = require('web-audio-api').AudioContext; const audioContext = new AudioContext; let resp = fs.readFileSync('sample

浏览 3提问于2017-10-07得票数 4

回答已采纳