使用librosa的对数mel谱图

、、、、

我正在使用python中的Librosa从GTZAN数据集中提取对数Mel谱图。我的代码是-mel = librosa.feature.melspectrogram(y=data, hop_length = 512//2, n_fft =

浏览 22提问于2019-11-07得票数 1

1回答

在Python中获取对数Mel谱图

、、

其他问题，如How to convert a mel spectrogram to log-scaled mel spectrogram，已经询问了如何在python中获得对数缩放的mel谱图。我下面的代码生成了上述语谱图 ps = librosa.feature.melspectrogram(y=y, sr=sr) ps_db= librosa.power_to_db(ps, ref=np.max

浏览 97提问于2020-07-22得票数 2

回答已采纳

2回答

对于基于CNN的模型，哪个语谱图最能代表音频文件的特征？

、、、、

我希望了解音频分析的各种频谱图。我想将一个音频文件转换为10秒的块，为每个块生成光谱图，并使用CNN模型在这些图像上进行训练，看看它们是好是坏。我已经研究了线性，对数，mel等，并在某个地方读到基于mel的频谱图最适合用于此。但是没有适当的可证实的信息。我已经使用了以下简单的代码来生成mel谱图</em

浏览 46提问于2019-04-04得票数 0

回答已采纳

1回答

为什么我的8 8kHz文件的mel特征在sr =16 8kHz和44.1kHz中提取不同

、、、

我目前正在从我的婴儿哭声数据集中提取mel特征，wav文件的采样率为8 8kHz、16位、单声速和大约7秒。sr =16000时的Mel谱 import lib

浏览 1提问于2019-07-16得票数 6

回答已采纳

1回答

从频谱图时间/频率序列数组中获取MFCC

、、

我有几个光谱时间/频率500,1024的文件。我需要计算这些文件的MFCC。有很多用于计算原始音频文件的MFCC的库，但我正在寻找python中直接从np.array计算MFCC的方法。

浏览 40提问于2019-06-01得票数 0

1回答

从密尔谱图中重建音频有一些与librosa有关的剪辑。

、、、、

我正在做： y=samples, sr=sample_rate, window=print('melspectrogram.shape', melspectrogram.shape) audio_signal = librosa.feature.inverse.mel_to_audioprint(audio_signal, audio_si

浏览 1提问于2020-02-23得票数 0

回答已采纳

2回答

如何将mel谱图转换成原形的mel谱图

、

我正在阅读使用卷积神经网络进行环境噪声识别的本论文，并希望复制它们的结果。他们将WAV文件转换成日志大小的mel光谱图。你是怎么做到的？我能够将WAV文件转换成mel谱图ps = librosa.feature.melspectrogram(y=y,

浏览 0提问于2018-02-09得票数 4

1回答

如何将mel谱图转换成原形的mel谱图

、、、、

我正在阅读使用卷积神经网络进行环境噪声识别的，并希望复制它们的结果。他们将WAV文件转换成日志大小的mel光谱图。你是怎么做到的？我能够将WAV文件转换成mel谱图ps = librosa.feature.melspectrogram(y=y, sr

浏览 1提问于2018-02-08得票数 0

3回答

mel谱图与MFCC的区别

、、

我正在使用librosa库将音乐片段转换为mel频谱图，以用作我的神经网络的输入，如文档所示。这与有什么不同呢？使用这两种方法有什么优点或缺点吗？

浏览 5提问于2018-12-26得票数 18

1回答

从FFT数据中创建波形数据？

、、、、

正如您可能注意到的，我对python和声音处理非常陌生。我(希望)使用python、logfbank和mfcc函数从波形文件中提取FFT数据。( logfbank似乎给出了最有希望的数据，mfcc的输出对我来说有点奇怪)。到目前为止，这是我的

浏览 1提问于2019-07-08得票数 1

1回答

Librosa -如何创建立体声音频的mel谱图？

、、

有一个为单声道音频生成mel谱图的代码。import librosa, librosa.displayimport numpy as np librosa.featur

浏览 41提问于2020-10-19得票数 0

回答已采纳

1回答

关于声码器的使用

、、、

我有一个令人困惑的问题，那就是投票人的使用。但是，在其他模型中，如，，，对于wav到Mel光谱图<

浏览 23提问于2022-02-01得票数 1

回答已采纳

1回答

、、、

我遇到了使用librosa为音频文件生成log-mel频谱图的两种不同方法，我不知道它们在最终输出中为什么不同，哪一种是“正确的”，或者一种与另一种有多大的不同。#1 path = "path/to/my/file"mel_spectrogram = librosa.feature.melspectrog

浏览 262提问于2021-05-09得票数 0

1回答

Python Librosa* :用于计算MFCC特征的默认帧大小是多少？*

、、

使用Librosa库，我将MFCC功能的1319秒的音频文件生成了一个矩阵20 X 56829。这里的20表示MFCC功能的编号(我可以手动调整)。但我不知道它是如何将音频长度分割成56829的。处理音频所需的帧大小是多少？import numpy as npimport librosa

浏览 3提问于2016-06-22得票数 9

回答已采纳

1回答

音频采样率与音频的跳长、滤波长度、窗口长度有什么关系，下采样对音频参数有何影响？

、、、、

我有大约20K文件的音频数据，采样率为44100 20K。我正在使用这些数据来训练文本到语音的塔卡创模型。然而，为成功的培训配置的参数如下:因此，我需要将数据降到22.5Khz。max_wav_value=32768.0,filter_length=1024,win_length=1024,mel_fmin=0.0, mel_fmax=

浏览 0提问于2021-04-19得票数 0

回答已采纳

1回答

使用Librosa将Mel-谱图PNG转换为语音，这有可能吗？

、、、

我能把mel-谱图png转换成用python(librosa，scipy.)声音'wav‘吗？因为我有gan项目来生成mel-谱图图像，我不想再把它们转换成声音1-将wav转换成mel-谱图，并将结果保存为png。4-

浏览 3提问于2021-08-07得票数 0

回答已采纳

1回答

如何用melspectogram将wav文件转换成RGB图像？

、、、

我正在用从1秒到4秒的wav文件进行声音分类。我想转换wav到224x224x3图像，我可以收费到Resnet分类，转换应该是使用melspectogram谢谢帮助

浏览 112提问于2019-05-27得票数 2

回答已采纳

1回答

如何更改mel-spectogram的大小？

、、、

我想将3个mel-spectogram保存到一个png文件。为此，我使用了subplots函数。fig, ax = plt.subplots(nrows=3, ncols=1)img2 = librosa.display.specshow(S_dB2, sr=sr, fmax=10000, ax=ax[1]) img3 = librosa.display.specsho

浏览 0提问于2020-10-25得票数 0

2回答

使用librosa函数将语谱图转换为音频

、、、

我正在从事语音合成工作，我已经使用librosa构建了频谱图。当我想要将频谱图转换为音频以保存为wav文件时，它会产生问题。我寻求帮助，发现liborsa有一个函数mel_to_audio，但这不起作用。我使用这个函数来获取音频文件的频谱图。librosa.feature.melspectrogram 这是我用来将语谱图转换成音频的函数。 librosa.fea

浏览 284提问于2019-09-17得票数 1

回答已采纳

1回答

用于生物声学机器学习的MEL与线性谱图

、、、、

我没有生物声学的背景，但从事生物声学的数据科学项目。动物是蝙蝠，人们知道它们会发出高频率的声音。在背景文献中，我发现MEL谱图也适用于蝙蝠，并了解到MEL谱图将范围压缩成对数尺度。但如果是这样的话，我预计信息丢失的频率最高，如果是的话，我预计使用MEL的结果会更

浏览 0提问于2023-02-28得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

Librosa Mel-频谱图日志形状

在Python中获取对数Mel谱图

对于基于CNN的模型，哪个语谱图最能代表音频文件的特征？

为什么我的8 8kHz文件的mel特征在sr =16 8kHz和44.1kHz中提取不同

从频谱图时间/频率序列数组中获取MFCC

从密尔谱图中重建音频有一些与librosa有关的剪辑。

如何将mel谱图转换成原形的mel谱图

如何将mel谱图转换成原形的mel谱图

mel谱图与MFCC的区别

从FFT数据中创建波形数据？

Librosa -如何创建立体声音频的mel谱图？

关于声码器的使用