Librosa:无法为Windows上的mfcc提供窗口函数

腾讯云

开发者社区

文档建议反馈控制台

首页

文章/答案/技术大牛

发布

1回答

、、、、

我目前正在试验librosa，以重现一种科学方法(深度学习)，该方法使用PRAAT来提取音频文件的MFCC。论文的作者在MFCC计算中使用了Hamming窗口，我试图在mfcc的函数调用中提供该函数作为附加参数，或者作为**kwargs的一部分作为字典：from scipy.signal在我的Windows计算机上，在Ana

浏览 39提问于2019-11-13得票数 5

1回答

从用librosa.feature.mfcc生成的MFCC中获取定时信息

、、、

我正在使用Librosa的函数(librosa.feature.mfcc)从音频文件中提取MFCC，并且我正确地获得了一个具有我所期望的形状的numpy数组:13个MFCC值用于音频文件的整个长度，即1292个窗口(30秒内)。缺少的是每个窗口的时间信息:例如，我想知道MFCC在时间上是什么样子，5000 is

浏览 8提问于2020-12-11得票数 3

回答已采纳

1回答

Librosa未能绘制生成的mfcc

、、、

我是能够生成MFCC从系统捕获的音频和绘图，但经过一些重构和配置Tensorflow与CUDA。我使用Librosa生成mfcc，matplotlib.pyplot和librosa.display绘制MFCC和声音设备从立体声混合捕捉声音从窗口。当前的配置可以根据示例.wav文件创建和绘制MFCC，但是当使用系统捕获的声音时，它无法绘制它，因为它生成一个3D数组，而不是在运行MFCC</em

浏览 6提问于2022-04-03得票数 0

1回答

Python Librosa* :用于计算MFCC特征的默认帧大小是多少？*

、、

使用Librosa库，我将MFCC功能的1319秒的音频文件生成了一个矩阵20 X 56829。这里的20表示MFCC功能的编号(我可以手动调整)。但我不知道它是如何将音频长度分割成56829的。处理音频所需的帧大小是多少？import numpy as npimport librosa def getPathToGroundtruth(episod

浏览 3提问于2016-06-22得票数 9

回答已采纳

2回答

MFCC Python: librosa vs python_speech_features vs tensorflow.signal的结果完全不同

、、、、

我正在尝试从音频(.wav文件)中提取MFCC特性，我已经尝试过python_speech_features和librosa，但是它们的结果完全不同：hop_length = int(sr/100)features_librosa = librosa.feature.mfcc为什么这里有这么

浏览 1提问于2020-03-02得票数 8

回答已采纳

1回答

执行命令提取mfcc后返回的是什么？

、、、

我一直在学习声音分析，我在其中遇到了术语mfcc。因此，当我执行librosa.feature.mfcc(y=X, sr=sample_rate, n_mfcc=40)时，我得到了40×216号形状的numpy数组。但是在这里，框架的确切含义是什么，它是否类似于采样率，以及我们在加载音频文件时定义它的位置。

浏览 29提问于2020-04-20得票数 1

回答已采纳

1回答

了解mfcc的输出

、、、、

from librosa.feature import mfcc data, frame= load(sound) 我想得到以下sound.wav文件的MFCC，它是48

浏览 2提问于2018-09-08得票数 10

回答已采纳

2回答

为什么librosa* librosa.feature.mfcc()会吐出一个2D数组？*

、

调用音频文件上的librosa.feature.mfcc()会发出一个2D数组，如下所示： [ 3.109e-14, -5.058e+00, ..., 2.931e-14, 2.931e-14]]) 我的问题是这些是什么因为我期待一个一维的系数数组，为什么它是二维的</em

浏览 3提问于2016-03-23得票数 1

回答已采纳

4回答

tensorflow mfcc和librosa* mfcc有可能得到完全相同的结果吗？*

、、、

我尝试让tensorflow mfcc提供与python lybrosa mfcc相同的结果。我尝试匹配tensorflow代码中librosa使用的所有默认参数，但得到了不同的结果waveform = contrib_audio.decode_wav(1e-6) log_mel_spe

浏览 4提问于2017-11-01得票数 2

1回答

keras:如何编写自定义的损失函数，将帧级别的预测聚合为歌曲级别的预测

、、、、

对于每首歌曲，我将它们切成小帧(5s)，以生成MFCC作为神经网络的输入特征，并且每个帧都有一个关联的歌曲流派标签。我知道我可以随机选择，比如说80%的歌曲(它们的小框架)作为训练数据，其余的作为测试数据。但现在我编写X_train的方式是帧级别的帧，而biney交叉熵损失函数是在帧级别定义的。我想知道如何自定义损失函数，使其在帧级预测的聚合(例如，歌曲的每个帧预测的</e

浏览 11提问于2019-03-21得票数 1

回答已采纳

0回答

Python中的简单Tensorflow代码中存在错误

、、、、

我有一个用python (Anaconda3，Ubuntu16.04)编写的深度学习代码。它基本上是根据训练好的模型对给定的视频进行广告检测，必须返回视频是否为广告(我们假设它只是一个单镜头视频)。我的同事现在没空，他写了这篇文章。 mfcc_li

浏览 6提问于2017-11-20得票数 1

回答已采纳

6回答

librosa.util.exceptions.ParameterError:单声道音频的无效形状: ndim=2，shape=(172972，2)

、、、

: Invalid shape for monophonic audio: ndim=2, shape=(172972, 2)import librosaimport osimport picklefrom(X)) if mfcc</em

浏览 0提问于2020-01-09得票数 4

1回答

Librosa Keras音乐分析神经网络Python:输入值错误

、、、、

我的实验是以一篇详细阐述这个项目的基础的文章为基础的： import matplotlib.pyplot as plt y, _ = librosa.load(song) mf

浏览 0提问于2019-01-20得票数 1

5回答

使用Python Librosa比较两个声音的相似性

、、

我有大约30个声音剪辑，每个都是合成器的预设。我想要比较这些声音，找出哪些是相似的，然后对声音进行排序，使每个声音在列表中与两个与其相似的声音相邻。频率不是我唯一想要寻找的东西。仅通过查看频谱图，我就能够猜测哪些声音可能相似，然后通过听实际的声音来确认这一猜测，例如，下图中的和在这类声音中，12和20应该很接近。但是我想让这个过程自动化根据我对Librosa的查找，看起来我可以计算一些东西，比如rms，mfcc和质心来确定相似性。但我不知道如何比较我计算<

浏览 10提问于2020-10-29得票数 2

1回答

我的librosa* MFCC输出是正确的吗？我想我在使用librosa *MFCC时得到了错误的帧数。

、、、、

result=librosa.feature.mfcc(signal, 16000, n_mfcc=13, n_fft=2048, hop_length=400)信号长1秒，采样率为16000，计算了13个长度为400跳的MFCC。输出尺寸为(13,41)。为什么我有41帧，不是应该是(time*sr/hop_length)=40吗？

浏览 2提问于2021-07-01得票数 2

回答已采纳

1回答

绘制歌曲中每个唯一声音循环的时间框架，并使用python按声音相似性排序行。

、、、、

问题描述 mfcc = librosa.feature.mfcc</em

浏览 8提问于2020-12-11得票数 10

1回答

如何在Weka中使用MFCC进行音频分类？

、、、、

我正在尝试开发一种方法来分类音频使用MFCC在Weka。我所拥有的MFCC是以1024的缓冲大小产生的，因此对于每个音频记录都有一系列MFCC系数。MFCC的每个系数是单独的属性还是作为单个属性的系数数组？每个数据是否代表一个MFCC，一个时间窗口，还是整个文件或声音？在更深入地阅读了我找到的之后，我看到了累加脚本、测试和训练数据文件。累加脚本将从不同音频文件中生成的</e

浏览 8提问于2017-07-20得票数 2

回答已采纳

1回答

MFCC数组中的第二个数字是什么？

、、、

当我从音频中提取MFCC时，输出是(13, 22)。这个数字代表什么？这是时间范围吗？我用利布罗萨。使用的代码是：mfccs 输出的是(13,22)。

浏览 1提问于2020-07-04得票数 2

回答已采纳

2回答

如何在.gz中读取wav文件？

、

我正在学习机器学习和wav文件的数据分析。我知道如果我有直接的wav文件，我可以这样做来读取数据现在我得到了一个gz文件的"music_feature_extraction_test.tar.gz"，我不知道现在该做什么我试过： with gzip.open(

浏览 1提问于2018-05-06得票数 0

回答已采纳

2回答

'/usr/local/lib/python3.7/site-packages/librosa/util/matching.py‘：无法缓存函数'__jaccard'：没有用于文件RuntimeError的定位器

、、

我正在windows10机器上对接烧瓶应用程序，我在码头运行后得到以下错误在我的机器上，烧瓶应

浏览 0提问于2019-07-11得票数 6

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云