从文档来看,https://pytorch.org/audio/stable/backend.html#torchaudio.backend.sox_io_backend.load似乎没有固定采样率加载音频的参数,这对于训练模型是很重要的。
如何用固定采样率加载具有固定采样率的火炬音频张量?
发布于 2022-08-23 17:43:24
您可以使用torchaudio.functional.resample
重采样
arr, org_sr = torchaudio.load('path')
arr = torchaudio.functional.resample(arr, orig_freq=org_sr, new_freq=new_sr)
发布于 2022-02-14 07:30:00
Resample
可以从转换中使用。
waveform, sample_rate = torchaudio.load('test.wav', normalize=True)
transform = transforms.Resample(sample_rate, sample_rate/10)
waveform = transform(waveform)
https://stackoverflow.com/questions/71108331
复制相似问题