如何将Librosa频谱图保存为特定大小的图像？_在计算特定大小的频谱图时，有没有办法确定信号的长度_将终端下的Matlab隐形图保存为相同大小的图像 - 腾讯云开发者社区

python、matplotlib、conv-neural-network、librosa、image-classification

我有大约5000个音频样本，并已使每个频谱图，并保存为图像。我已经知道如何用librosa制作光谱图，显示它并保存在正确的图像中。但每次在保存图像之前，它都会降低成本。用所有5000个样本制作这个不是一个好主意。是否可以在不显示图像的情况下保存图像？ import numpy as np import librosa import librosa.display import matplotlib.pyplot as plt f_name = # path to current file path = # path where to save result X, s_rate = libr

浏览 0提问于2020-12-02得票数 0

2回答

将频谱图作为图像存储在Python中

python-3.x、audio、python-imaging-library、librosa

我想将音频的短时傅立叶变换谱图存储为图像。下面的代码向我显示了一个光谱图作为输出，但当保存为图像时，我得到了一个不同的图像。 import numpy as np import matplotlib.pyplot as plt import pandas as pd audio_name = '---.au' hop_length = 512 window_size = 1024 import librosa y, sr = librosa.load(audio_name) window = np.hanning(window_size) out = librosa.co

浏览 0提问于2018-09-21得票数 8

回答已采纳

1回答

如何将Librosa频谱图保存为特定大小的图像？

python、matplotlib、audio、librosa

因此，我想将频谱图图像输入到卷积神经网络中，以尝试对各种声音进行分类。我希望每个图像都恰好是384x128像素。然而，当我实际保存图像时，它只有297x98。下面是我的代码： def save_spectrogram(num): dpi = 128 x_pixels = 384 y_pixels = 128 samples, sr = load_wave(num) stft = np.absolute(librosa.stft(samples)) db = librosa.amplitude_to_db(stft, ref=np.max) fig = plt.fi

浏览 146提问于2019-06-23得票数 14

1回答

使用librosa的对数mel谱图

python、audio、signal-processing、librosa

我遇到了使用librosa为音频文件生成log-mel频谱图的两种不同方法，我不知道它们在最终输出中为什么不同，哪一种是“正确的”，或者一种与另一种有多大的不同。 #1 path = "path/to/my/file" scale, sr = librosa.load(path) mel_spectrogram = librosa.feature.melspectrogram(scale, sr, n_fft=2048, hop_length=512, n_mels=10, fmax=8000) log_mel_spectrogram = librosa.power_to_d

浏览 262提问于2021-05-09得票数 0

3回答

mel谱图与MFCC的区别

spectrogram、mfcc、librosa

我正在使用librosa库将音乐片段转换为mel频谱图，以用作我的神经网络的输入，如文档所示。这与有什么不同呢？使用这两种方法有什么优点或缺点吗？

浏览 5提问于2018-12-26得票数 18

1回答

如何将谱图图像直接保存到特定像素大小

python、image、spectrogram

我正在生成光谱图，并将它们投射到用于CNN的图像中。如何才能直接指定光谱图的像素大小。到目前为止，这就是我所拥有的： import matplotlib.pyplot as plt import librosa import librosa.display filename = (r'G:pt5GAL_TCL_mono.wav') y, sr = librosa.load(filename) fig, ax = plt.subplots(figsize=(5, 5)) ax.set_axis_off() ax.specgram(y, Fs=2); fig.savefig

浏览 9提问于2022-04-29得票数 0

1回答

如何在librosa中从mel谱图重建STFT矩阵，以便重建原始音频？

python、audio、signal-processing、spectrogram、librosa

我已经使用下面的代码在librosa中生成了一个梅尔谱图 import os from matplotlib import pyplot as plt import librosa import librosa.display import pylab import numpy as np x, sr = librosa.load('audio/example.wav') mel = librosa.feature.melspectrogram(x,sr) P = librosa.power_to_db(mel, ref=np.max) librosa.display.sp

浏览 1提问于2020-08-31得票数 0

1回答

如何记录二维矩阵/图像的刻度

python、numpy、python-imaging-library、librosa、spectrogram

我有一个二维数字阵列的音频谱图，我想把它保存为图像。我用库来获取光谱。我也可以用librosa.display.specshow()函数绘制它。如下所示，有许多不同的缩放类型。 import PIL import librosa import librosa.display def display_spectrogram(spectrum, sampling_rate): """ Frequency types: ‘linear’, ‘fft’, ‘hz’ : frequency range is determined by the FFT

浏览 2提问于2020-11-22得票数 4

回答已采纳

2回答

使用matplotlib设置创建specgram的宽度和高度

python、matplotlib、librosa、spectrogram

我正在尝试使用自定义的宽度和高度绘制频谱图，但当我运行以下代码时，它会抛出以下错误，但当我删除自定义的宽度和高度时，它可以很好地工作，但它会创建515x389的频谱图代码： filename = path x, sr = librosa.load(filename, mono=True) widthHeight = (432, 288) plt.figure(figsize=widthHeight) plt.specgram(x, NFFT=2048, Fs=2, Fc=0, noverlap=128, cmap='inferno', sides='default&

浏览 292提问于2021-03-11得票数 0

1回答

使用Librosa将Mel-谱图PNG转换为语音，这有可能吗？

python、generative-adversarial-network、librosa、spectrogram

我能把mel-谱图png转换成用python(librosa，scipy.)声音'wav‘吗？因为我有gan项目来生成mel-谱图图像，我不想再把它们转换成声音我的程序是： 1-将wav转换成mel-谱图，并将结果保存为png。 2-将png结果提供给生成器。 3-发生器的结果是mel-谱图，将结果保存为png。 4-问题=> “发生器对WAV的CONVERTE PNG结果” 任何解决方案，或替代生产这一周期将不胜感激。

浏览 3提问于2021-08-07得票数 0

回答已采纳

2回答

使用librosa函数将语谱图转换为音频

python、audio、spectrogram、librosa

我正在从事语音合成工作，我已经使用librosa构建了频谱图。当我想要将频谱图转换为音频以保存为wav文件时，它会产生问题。我寻求帮助，发现liborsa有一个函数mel_to_audio，但这不起作用。我使用这个函数来获取音频文件的频谱图。 librosa.feature.melspectrogram 这是我用来将语谱图转换成音频的函数。 librosa.feature.inverse.mel_to_audio 但是我得到了这个错误。 ModuleNotFoundError: No module named 'librosa.feature.inverse' 这就是我使用

浏览 284提问于2019-09-17得票数 1

回答已采纳

1回答

Librosa -音频频谱图/频段到频谱

python、audio、librosa、spectrogram

我已经到处看了几天了，但还没有找到解决方案……我可以使用以下内容构建Librosa频谱图并提取振幅/频率数据： audio, sr = librosa.load('short_piano melody_keyCmin_110bpm.wav', sr = 22500) spectrum = librosa.stft(audio, n_fft=2048, window=scipy.signal.windows.hamming) D = librosa.amplitude_to_db(np.abs(spectrum), ref=np.max) n = D.shape[0] Nfft

浏览 47提问于2021-06-04得票数 0

回答已采纳

1回答

如何获取音频文件中特定时间戳的特定频率？

python、pyaudio、librosa

嗨，我目前正在使用Librosa做一个音频项目，我想知道如何在音频文件中获得特定时间帧的频率振幅。我不知道这是不是很简单，但是我已经在网上找过了，什么也找不到。我知道你可以产生一个频谱图，但是你怎么能得到信息，比如在给定时间戳上a频率的振幅？编辑:我指的是时间戳上的振幅。

浏览 1提问于2018-11-28得票数 0

1回答

librosa曲线图y轴刻度错误？

python、audio、signal-processing、librosa、mel

我在试着找出为什么梅尔尺度谱图似乎有错误的频率尺度。我生成了一个4096 the的音调，并使用librosa的显示库绘制了它，但音调与已知的频率不一致？很明显我做错了什么，有人能帮帮忙吗？谢谢! import numpy as np import librosa.display import matplotlib.pyplot as plt sr = 44100 t = np.linspace(0, 1, sr) y = 0.1 * np.sin(2 * np.pi * 4096 * t) M = librosa.feature.melspectrogram(y=y, sr=sr) M_

浏览 96提问于2021-01-31得票数 0

1回答

Librosa逆梅尔谱图花了很长时间

python、audio、spectrogram、librosa、mfcc

我目前正在尝试将mel谱图转换回音频文件，然而，librosa的mel_to_stft功能需要很长时间(至少15分钟)才能在384 mel采样的30秒.wav文件中读取。以下是我的代码： # Code for high pass filter def butter_highpass(cutoff, fs, order=5): nyq = 0.5 * fs normal_cutoff = cutoff / nyq b, a = butter(order, normal_cutoff, btype='high', analog=False) ret

浏览 12提问于2020-08-07得票数 2

2回答

如何在单个图形上绘制声波、mfcc和mel频谱图？

matplotlib、subplot

我有一个包含多个wav文件的文件夹(目前是4个)。我想在一行中绘制wav，它的mfcc和mel频谱图，所以最后是一个有12个图形的图形(每行有3个图形，因此是4行)。我无法绘制图表，只能提取特征。有人可以帮助这个for循环吗？我的意思是如何使用subplot命令以及如何在循环中存储每个图形。问候 path=glob.glob('the path having four wav files/*.wav') for p in path: y, sr = librosa.load(p, sr=16000) mfcc=librosa.feature.mfcc(y)

浏览 129提问于2021-08-16得票数 0

回答已采纳

1回答

如何从音频文件的分解谱图中计算出实际的谱图？

python、audio-analysis

我从一个音频文件中分解了频谱图，如下所示： import librosa y, sr = librosa.load('my audio file.wav') S = np.abs(librosa.stft(y)) W, H = librosa.decompose.decompose(S, n_components=32) 现在如何将分解后的谱图重新组合成实际的谱图。我想要的是这种类型的功能： S=recompose(W,H)

浏览 42提问于2018-09-02得票数 0

1回答

在计算特定大小的频谱图时，有没有办法确定信号的长度

matlab、image-processing、signal-processing、fft、spectrogram

有没有办法确定信号的长度和窗口大小，以便创建用户指定维度x*y的谱图？例如，为了创建大小为100*100的谱图，信号的长度是N=80050和w = 80。我已经用matlab生成了一个信号的频谱图，如下所示： N = 80050; w = 80; signal = randn(1,N); spec=spectrogram(signal,w,0,256); specto= spec(1:100,1:100); specto_power=(20*log10(abs(specto))); specMin_1 = min(specto_power(:)); specMax_1 = max

浏览 66提问于2020-09-13得票数 1

回答已采纳

1回答

Gnuradio: 1个样本的FFT图

python、gnuradio、gnuradio-companion

我使用GNU无线电接收无线电信号，并使用元数据将其写入文件(复杂)。然后我用python解析文件，我有一个变量和一个样本(8字节)。我想要建立一个特定的样本或保存为图像的FFT图。那是真的吗？我可以用GRC来做这件事吗，或者python有库来做这件事？谢谢

浏览 26提问于2021-09-20得票数 0

1回答

MFCC谱图与枕谱图

scipy、librosa、spectrogram、mfcc

我目前正在研究一种卷积神经网络(CNN)，并开始研究不同的光谱图：关于Librosa图(MFCC)，谱图与其它谱图有很大的不同。我看了一看谈论的“未详细的”MFCC谱图。如何完成由提供的解决方案发布的任务(Python代码明智)？此外，这个低分辨率的MFCC阴谋会错过任何滋扰的图像通过CNN？如果您在执行代码方面有任何帮助，我们将衷心感谢！这是我用来比较光谱图的Python代码，这里是正在分析的wav文件的。 Python代码 # Load various imports import os import librosa import librosa.display impo

浏览 3提问于2020-12-14得票数 1

回答已采纳

1回答

如何将mel谱图转换成原形的mel谱图

python、audio、speech-recognition、spectrogram、librosa

我正在阅读使用卷积神经网络进行环境噪声识别的，并希望复制它们的结果。他们将WAV文件转换成日志大小的mel光谱图。你是怎么做到的？我能够将WAV文件转换成mel谱图 y, sr = librosa.load('audio/100263-2-0-117.wav',duration=3) ps = librosa.feature.melspectrogram(y=y, sr=sr) librosa.display.specshow(ps, y_axis='mel', x_axis='time') 我还可以将它显示为一个日志缩放的光谱图： l

浏览 1提问于2018-02-08得票数 0

2回答

如何将mel谱图转换成原形的mel谱图

python、speech-to-text

我正在阅读使用卷积神经网络进行环境噪声识别的本论文，并希望复制它们的结果。他们将WAV文件转换成日志大小的mel光谱图。你是怎么做到的？我能够将WAV文件转换成mel谱图 y, sr = librosa.load('audio/100263-2-0-117.wav',duration=3) ps = librosa.feature.melspectrogram(y=y, sr=sr) librosa.display.specshow(ps, y_axis='mel', x_axis='time') 📷 我还可以将它显示为一个日志缩放的光谱图： l

浏览 0提问于2018-02-09得票数 4

1回答

将scipy.signal.stft数据传递给librosa.feature.melspectrogram

python、scipy、librosa

我的源代码如下所示。它显示的错误如下 librosa.util.exceptions.ParameterError: Audio data must be floating-point 我还不清楚如何设置librosa.feature.melspectrogram参数。我应该怎么改变？？ sample_wave = './data/mywave.wav' wav=wave.open(sample_wave) data=wav.readframes(wav.getnframes()) data = np.frombuffer(data,dtype=np.int16) f,

浏览 57提问于2020-11-09得票数 0

2回答

WAV文件和M4A文件有什么不同？

audio、format、fft、spectrogram

我想把一些音频文件转换成光谱图。我想知道m4a和wav文件有什么不同。如果我有两个相同的音频记录，一个保存为wav，另一个保存为m4a，两者的频谱表示是否会有所不同？

浏览 58提问于2019-10-31得票数 2

1回答

如何从Python中的音频文件创建频谱图图像，就像FFMPEG一样？

python、ffmpeg、speech-recognition、spectrogram

我的代码： import matplotlib.pyplot as plt from matplotlib.pyplot import specgram import librosa import librosa.display import numpy as np import io from PIL import Image samples, sample_rate = librosa.load('thabo.wav') fig = plt.figure(figsize=[4, 4]) ax = fig.add_subplot(111) ax.axes.get_xaxi

浏览 47提问于2020-04-30得票数 0

回答已采纳

1回答

如何利用librosa实现部分声音的转置

python、wav、librosa

例如， y, sr = librosa.load("sound.wav",sr=44100,mono=True) half = int(y.shape / 2) y1 = y[:half] y2 = y[half:] y_pit= librosa.effects.pitch_shift(y2, sr, n_steps=24) y = np.concatenate([y1,y_pit]) 这段代码只导入sound.wav和音调偏移的后半部分，最后生成一个声音文件。现在，我想要做的是更多。我想只在特定的赫兹附近进行音调调整，比如440hz=A 例如在这种情况下，我有声音(

浏览 42提问于2020-12-13得票数 1

回答已采纳

2回答

对于基于CNN的模型，哪个语谱图最能代表音频文件的特征？

python-3.x、machine-learning、audio、spectrogram、librosa

我希望了解音频分析的各种频谱图。我想将一个音频文件转换为10秒的块，为每个块生成光谱图，并使用CNN模型在这些图像上进行训练，看看它们是好是坏。我已经研究了线性，对数，mel等，并在某个地方读到基于mel的频谱图最适合用于此。但是没有适当的可证实的信息。我已经使用了以下简单的代码来生成mel谱图。 y,sr= librosa.core.load(r'C:\Users\Tej\Desktop\NoiseWork\NoiseOnly\song.wav') S = librosa.feature.melspectrogram(y=y, sr=sr) librosa.display

浏览 46提问于2019-04-04得票数 0

回答已采纳

1回答

如何做基于音频的直方图均衡？

python、python-3.x、signal-processing

我已经尝试过基于图像的直方图均衡化，它工作得很好。但是现在我想用音频代替图像灰度来实现同样的方法。这意味着我想让频谱变得更平坦。我使用的采样率是44.1 The，希望使频率均匀分布到0-22050 the的范围，但峰值仍然是最高的。以下是频谱：这就是我尝试过的：我认为我绘制的原始直方图已经是错误的，我无法计算每个频率出现的次数，或者我根本不应该这样做。有人告诉我需要使用fft()，但我不知道怎么做。任何帮助都将不胜感激！谢谢下面是我如何绘制频谱的代码： import librosa import numpy as np import matplotlib.pypl

浏览 1提问于2020-12-10得票数 1

1回答

如何使用librosa获得音乐信号的整个时间段的频谱？

python、signal-processing、librosa

我决定使用来分析音乐信号并提取所需的特征。目前，我正在尝试可视化整个时间的音乐频谱。我在库中找到了这个执行短时傅立叶变换并返回光谱的。但其中一个返回矩阵，其中为特定帧计算频谱，而不是所有时间。有没有可能使用这个库来计算整个时间的频谱，或者以某种方式处理给定的矩阵，或者在librosa中有一个特殊的方法来实现这一目的？如果没有--你能推荐另一个图书馆吗？提前谢谢你。

浏览 1提问于2017-10-09得票数 1

3回答

在Librosa获取与STFT相关的频率

python、signal-processing、fft、librosa、dft

当使用librosa.stft()计算光谱图时，如何获得相关的频率值？我不想像在librosa.display.specshow中那样生成一个映像，而是想要掌握这些值。 y, sr = librosa.load('../recordings/high_pitch.m4a') stft = librosa.stft(y, n_fft=256, window=sig.windows.hamming) spec = np.abs(stft) spec给出了每个频率的“振幅”或“功率”，而不是频率本身。我已经看到，有一个display.specshow函数将在热图的垂直轴上显示这些频率

浏览 5提问于2020-08-11得票数 6

回答已采纳

1回答

使用Librosa生成的光谱图看起来与Kaldi不一致？

speech-recognition、spectrogram、mfcc、librosa、kaldi

我使用Kaldi的“egs/十位数”代码生成了一个“七”字的声谱图，使用23个回收箱，20 the采样率，25毫秒窗口和10毫秒移位。谱图如下所示，通过MATLAB图像c函数可视化：我正在试验使用Librosa代替Kaldi。我使用相同数量的回收箱、采样率和窗口长度/移位设置代码如下。 time_series, sample_rate = librosa.core.load("7a.wav",sr=20000) spectrogram = librosa.feature.melspectrogram(time_series, sr=20000, n_mels=23,

浏览 3提问于2017-04-05得票数 3

回答已采纳

5回答

使用Python Librosa比较两个声音的相似性

python、audio、librosa

我有大约30个声音剪辑，每个都是合成器的预设。我想要比较这些声音，找出哪些是相似的，然后对声音进行排序，使每个声音在列表中与两个与其相似的声音相邻。频率不是我唯一想要寻找的东西。我宁愿两个声调相隔的锯波被认为是相似的，一个锯波和一个正弦波是相同的音符。例如，这些声音将被认为是相似的使用，我已经能够对每个声音应用一个短时傅立叶变换，并从每个声音创建一个语谱图。仅通过查看频谱图，我就能够猜测哪些声音可能相似，然后通过听实际的声音来确认这一猜测，例如，下图中的和在这类声音中，12和20应该很接近。但是我想让这个过程自动化根据我对Librosa的查找，看起来我可以计算

浏览 10提问于2020-10-29得票数 2

2回答

不直接调用pyplot.specgram的Matplotlib谱图动画

python、matplotlib、spectrogram

我用这种方式制作了一个动画谱图： import matplotlib.pyplot as plt from matplotlib import animation import librosa WINDOW = 100_000 JUMP = 1000 INTERVAL = 1 FILENAME = 'sound.wav' sound, rate = librosa.load(FILENAME, sr=None) fig = plt.figure() def animate(i): chunk = sound[i * JUMP: i * JUMP + WINDOW

浏览 0提问于2018-11-20得票数 0

回答已采纳

1回答

Matplotlib绘图减少了延迟

python、matplotlib、librosa

我需要尽快画出一张谱图。用librosa计算频谱图，然后用matplotlib绘制。现在大约需要50ms，有没有可能更快？我对matplotlib和librosa非常陌生。这是我的代码： mel_spec = lb.melspectrogram(y=samples, sr=44100, fmax=8000, n_mels=256) plt.figure() plt.subplots(figsize=(0.5, 5)) librosa.display.specshow(librosa.power_to_db(mel_spec, ref=np.max), fmax=8000) plt.axi

浏览 18提问于2019-08-04得票数 0

2回答

为什么来自librosa库的声谱图的持续时间是实际音轨的两倍？

python、audio、spectrogram、librosa

我正在使用以下代码从记录的大约30秒的音频信号中获取Mel谱图： spectrogram = librosa.feature.melspectrogram(y=self.RawSamples,sr=self.SamplingFrequency, n_mels=128, fmax=8000) if show: plt.figure(figsize=(10, 4)) librosa.display.specshow(librosa.power_to_db(self.Spectrogram, ref=np.max), y_axis='mel'

浏览 5提问于2018-07-12得票数 2

回答已采纳

1回答

Librosa谱图参数

python、deep-learning、data-science、librosa

我想使用Librosa库来创建光谱图。我想使用librosa.core.stft函数进行语音处理。他们建议在我的情况下使用值为512的参数n_fft。我想知道的是，我应该为其他参数使用什么值才能获得最佳结果？我的意思是像hop_length和window_length这样的参数？

浏览 12提问于2020-03-12得票数 0

1回答

将谱图图像转换回音频

audio、generative-adversarial-network、spectrogram

我使用librosa生成了一些Mel-光谱图，用于生成对抗性网络(GANs)。我已经保存了生成的光谱图通过GAN的图像格式(.png)。现在我正试图将图像转换回音频。有可能吗？

浏览 6提问于2021-05-29得票数 0

1回答

基于音频长度的光谱图图像大小的确定

audio、librosa、fast-ai

我是遵循快速音频分类使用图像教程。对于长度为4秒的URBANSOUND数据集，图像大小为230x224。我使用的是DCASE音频数据集，它的长度为10秒。那么，在librosa中，如何根据音频的长度来确定图像的大小？下面是生成平面图的代码。 def create_fold_spectrograms(fold): spectrogram_path = Path('spectrogram/') audio_path = Path('audio/') print(f'Processing fold {fold}')

浏览 8提问于2020-06-04得票数 0

1回答

如何将实时flot图表保存为图像？

image、real-time、flot

我知道这种类型的问题已经被提出了。我已经看到了关于这个主题的答案，但我实际上并不知道如何将flot图表保存为图像(png或jpeg)。下面是我的实时图的打印屏幕。。当我单击“将图像另存为...”保存的照片是全黑的。我试过很多方法，但都不管用。那么我如何将我的图表保存为图像呢？

浏览 1提问于2016-02-24得票数 0

1回答

librosa.amplitude_to_db的概念目的是什么？

python、signal-processing、librosa

我正在使用librosa库从音频数据中获取和过滤光谱图。我主要理解生成光谱图背后的数学原理：获取信号窗口信号对于每个窗口计算傅里叶变换创建其列为转换的矩阵绘制此矩阵的热图所以对librosa来说这很容易 spec = np.abs(librosa.stft(signal, n_fft=len(window), window=window) 耶！我有我的FFTs矩阵。现在我看到了这个函数librosa.amplitude_to_db，我认为这就是我对信号处理的无知开始显现的地方。这是我在中等媒体上找到的一个片段： spec = np.abs(libros

浏览 7提问于2020-08-10得票数 3

回答已采纳

3回答

使用MFCC进行语音识别

python、keras、neural-network、voice-recognition、mfcc

我目前正在使用傅里叶变换结合Keras进行语音识别(说话人识别)。我听说MFCC是语音识别的更好的选择，但我不确定如何使用它。我在python (3)中使用librosa来提取20个MFCC特征。我的问题是:我应该使用哪些MFCC功能来识别说话人？除此之外，我不确定如何实现这些功能。我要做的是获得必要的特征，并为神经网络做一个长向量输入。然而，也可以显示颜色，所以图像识别也是可能的，还是更多地针对语音，而不是说话人识别？简而言之，我不确定我应该从哪里开始，因为我在图像识别方面经验不是很丰富，也不知道从哪里开始。提前感谢！！

浏览 4提问于2018-12-04得票数 0

1回答

在音频文件中，Librosa混合谱图的时间与实际时间不匹配

python、librosa

我试图使用librosa.feature计算MFCC系数，但当我使用specshow绘制它时，显示图上的时间与音频文件中的实际时间不匹配。我尝试了librosa docs 的代码，在这里我们创建了具有预先计算的日志功率Mel谱图的MFCC。 WINDOW_HOP = 0.01 # [sec] WINDOW_SIZE = 0.025 # [sec] y, fs = librosa.load('audio_dataset/0f39OWEqJ24.wav', sr=None) # fs is 22000 # according to WINDOW_SIZE

浏览 4提问于2019-10-12得票数 0

回答已采纳

1回答

使用librosa隔离音频前景并转换回音频流

python、audio、codec、librosa

我正在尝试分离音频流的前景，然后使用librosa将其保存为独立的音频流。从这个看似开始。我已经隔离了完整的、前台和后台数据，就像在S_full、S_foreground和S_background中的示例一样，但我不确定如何将这些数据用作音频。我尝试使用转换这些文件，然后使用soundfile.write(...)将其保存为.wav文件，但得到的文件大小大致相同，但无法使用(？)数据。有没有人能给我举个例子？谢谢。

浏览 8提问于2019-11-27得票数 1

1回答

有声字节数据到librosa浮点时间序列

audio、wav、pyaudio、librosa

当音频与paInt16一起录音时，它给了我16位整数，表示为两个字节。经过一番研究，我得出结论，一定是在-32768到32767之间。我将音频保存为wav文件，并将其加载回librosa.core.load。我确实检索了浮点值* 32767，并查看它是否生成原始的16位整数，但它根本不匹配。我的问题是这种错配是从哪里来的？原始16位整数数据是否代表频率？ librosa声明load函数返回floating point time series。如何从原始16位整数计算此值？

浏览 1提问于2018-11-24得票数 5

回答已采纳

1回答

我可以将librosa生成的频谱图转换回音频吗？

python、audio、signal-processing、spectrogram、librosa

我将一些音频文件转换为光谱图，并使用以下代码将其保存为文件： import os from matplotlib import pyplot as plt import librosa import librosa.display import IPython.display as ipd audio_fpath = "./audios/" spectrograms_path = "./spectrograms/" audio_clips = os.listdir(audio_fpath) def generate_spectrogram(x, sr, s

浏览 114提问于2020-04-10得票数 4

回答已采纳

1回答

librosa生成“不详细的”MFCC谱图

python、conv-neural-network、spectrogram、librosa、mfcc

我正在尝试用librosa创建一个MFCC图，但是这个图看起来不是很详细。目标是将此MFCC频谱图呈现给神经网络。我正在测试的音频文件大约有1秒长，来自Google Speech Commands数据集。我的代码是： WINDOW_SIZE = 20 NFFT=int((WINDOW_SIZE/1000)*16000) samples, _ = librosa.load(f, sr=16000) mfccs = librosa.feature.mfcc(y=samples[:16000], sr=16000, n_fft=NFFT, n_mfcc=40) plt.figure(figs

浏览 6提问于2019-11-27得票数 1

1回答

有没有办法自动将瀑布水槽图像导出为png文件？

png、qtgui、gnuradio

我一直在寻找用于瀑布水槽的png api，并希望将显示的输出保存为C++图像，而不是显示在gui上。我知道可以在窗口中right+click并以这种方式导出图像，但我很好奇是否可以制作一个自定义接收块来维护瀑布功能，但定期将其图像数据导出到PNG。我一直在研究QImage类：。

浏览 18提问于2020-03-10得票数 1

回答已采纳

1回答

如何在MATLAB中导出具有多个子图的窗口的PNG？

matlab、png、figure、subplot

我有8个数字和一个文本框(一个图例列出了模拟参数的值)。它们都是用子图()绘制在一个窗口中的。它看起来不错，但是窗户经常弹出来，分散了我对其他工作的注意力。我想要自动保存这些图形作为PNG图像，而不是让窗口不断弹出，以便我可以查看的情节和数字以后。我做什么，知道：如何将单个数字保存为PNG 如何使用子图在单个窗口中生成多个图形如何不显示带有单个图形的窗口(将该图形的可见性设置为“off”) 我不知道的是：如何使多个图形窗口不弹出如何设置多个图形窗口的大小(例如，400 px乘600 px) 如何将整个窗口导出到PNG 任何想法都将不胜感激。提前

浏览 1提问于2012-12-17得票数 2

2回答

stft中的时间箱数量与信号中的实际时间之间的关系是什么？

python、fft、frequency-analysis、spectrogram、time-frequency

我有一个9分钟的文件，它的采样率是16000。我的信号总共有9*60*16000= 8640000个样本。我正在用python (librosa软件包)做一个stft，并绘制光谱图。我知道频谱图的频率分辨率等于Fs(采样频率)/N(快速傅立叶变换点数)。如果我用N-fft= 2048绘制频谱图，那么我的频谱图的形状是(1025,16876)，x_axis显示时间为9分钟。如果用N-fft= 16384绘制它，那么我的频谱图的形状是(8193,2110)，x_axis显示时间为1分10秒。我不明白谱图的形状和我们在时间轴上看到的时间之间的关系。我还想知道谱图轴上的时间与信号中的实际时间之间的关

浏览 48提问于2019-07-17得票数 0

1回答

有没有办法使用librosa的波形图来存储图形的坐标，而不是显示波形图的图像？

python-3.x、librosa

我正在从事一个音频项目，其中我使用Librosa，并从一个在线示例中获得以下代码。我希望能够将构成图形的坐标存储在一个数组中，而不是打开一个包含振幅与时间关系图的图像。我在stackoverflow和其他网站上尝试了很多不同的例子，但都没有成功。我是python的新手，这是我关于stackoverflow的第一个问题，所以请善待我。 import librosa.display import matplotlib.pyplot as plt from IPython.display import display, Audio filename = 'queen2.mp3' s

浏览 29提问于2020-07-09得票数 1