保存音频文件的mel谱图而不显示其分解图

文章/答案/技术大牛

发布

1回答

python、librosa、spectrogram、mfcc

我想保存mfcc光谱图而不显示在Jupyter notebook输出中。我已经尝试使用以下代码保存mfcc光谱图，尽管输出中的曲线图发生了偏转。

浏览 8提问于2021-10-07得票数 0

2回答

用卷积神经网络处理熔体谱图

python、audio-recognition

使用librosa，我已经为一秒长的.wav音频文件创建了混合谱图。它返回640x480 .jpg文件。我现在的问题是如何继续输入，因为我认为输入对于网络来说太大了。如果是这样的话，什么才是适当的解决办法呢？大约60x60？它必须是二次型的吗？在我看来，各种选择：在将cv2.resize()传递给输入层之前，只需使用cv2。

浏览 0提问于2019-03-08得票数 2

回答已采纳

1回答

如何将CNN应用于短时傅立叶变换？

python、python-3.x、conv-neural-network、fft

所以我有一个返回.wav文件的短时傅里叶变换谱的代码。我希望能够利用，比方说一毫秒的光谱，并用它来训练CNN。ax.set_ylabel('Frequency [kHz]')plt.show() (请随意更正我在评论中提出

浏览 1提问于2019-05-24得票数 1

2回答

我正在从事语音合成工作，我已经使用librosa构建了频谱图。当我想要将频谱图转换为音频以保存为wav文件时，它会产生问题。我寻求帮助，发现liborsa有一个函数mel_to_audio，但这不起作用。我使用这个函数来获取音频文件的频谱图。librosa.feature.melspectrogram 这是我用来将语谱图转换成音频的函数。 librosa.feature.inverse.mel_t

浏览 284提问于2019-09-17得票数 1

回答已采纳

1回答

在音频文件中，Librosa混合谱图的时间与实际时间不匹配

python、librosa

我试图使用librosa.feature计算MFCC系数，但当我使用specshow绘制它时，显示图上的时间与音频文件中的实际时间不匹配。我尝试了librosa docs 的代码，在这里我们创建了具有预先计算的日志功率Mel谱图的MFCC。sr=None) # fs is 22000 # according to WINDOW_SIZE and fs, win_length is 550, and

浏览 4提问于2019-10-12得票数 0

回答已采纳

1回答

频谱图中窗口移位的影响？

python、matplotlib、signal-processing、librosa、spectrogram

我在DSP和生成音频文件的频谱图方面是相当新手。我的频谱图不平滑，它显示的是带有像素值的相当原始的图像，如下所示 ? 当我在寻找像这样一个平滑的谱图时 ? 我在哪里做错了？是因为窗口大小的原因吗？我生成Mel谱图的代码是 def readData(file): orig

浏览 65提问于2020-09-26得票数 0

1回答

将OGG (和其他格式)转换为MIDI？

convert、midi、ogg-vorbis

从midi文件中我应该期望什么样的质量？

浏览 0提问于2014-08-10得票数 3

回答已采纳

1回答

利用matlab进行谱图处理后提取FFT帧的局部极大值

matlab、audio、signal-processing、spectrogram

用谱图处理信号后，从FFT帧中提取局部极大值。手机的麦克风记录呼出并将数据存储在wav文件中。首先，我将音频缓冲为30 50帧(帧间重叠50% )。然后用hamming窗口对每个帧进行加窗，并取|FFT|db生成信号的幅度谱图。在用谱图处理信号后，我想利用每个帧中的局部最大值来提取共振，在滑动窗口上计算。然后，保存大于全局最大值20%

浏览 2提问于2016-11-21得票数 1

回答已采纳

1回答

控制光谱图大小的参数

python、signal-processing、spectrogram、librosa

我正试图得到如下说明所描述的谱图。据我所知，这个指令意味着n_mels=128和n_fft=1024在melspectrogram函数中。128 mel-scale大小是正确的，但是我得到的帧数是4

浏览 0提问于2018-07-09得票数 2

2回答

如何以一种可用于预处理和建模的格式表示音频数据？

python、deep-learning、classification、supervised-learning、audio-recognition

在train文件夹中，有多个文件夹，如cat、dog、elephant等，这些文件夹包含多个音频文件。例如，文件夹dog、cat等中有多个音频文件，文件夹也是表示音频所属的class的class名称。如何以一种可以使用机器学习模型的格式表示这些数据？为了稍微解释一下我的问题:让我们拿一个.csv文件。我们有行和列。行是数据点，列是特性，对此数据的培训机器培训模型是有意义的。

浏览 0提问于2019-09-07得票数 3

1回答

在tensorflow中创建自己的数据集

python、tensorflow、pytorch、conv-neural-network

我面临着用谱图对声音进行分类的任务。我有一个解决这个问题的方法(我将把所有的音频记录转换成光谱仪->，将它们保存为图片并为此训练一个神经网络)，但我想走更简单的方法，即不保存图片，而是立即将音频文件转换为张量，但是有一个问题，我找不到关于如何从TensorFlow中的张量中创建数据集的任何有用信息。trch = torch.from_numpy(log_mel_spectrogram)

浏览 4提问于2021-12-24得票数 2

2回答

声音的频率分析

frequency-analysis、audio-analysis

我用两个麦克风记录鸟儿的叫声。记录可以长达3个小时，每天听整个文件在audacity上是很耗时的。我想要的是一个脚本，它获取我的原始文件，并为我提供一组简短的音频文件，每个文件都包含一只鸟的叫声。通过我的麦克风，我可以用mp3或wav录音。但是脚本应该只接受频率高于nHz的呼叫。此频率表示固定的、不应保存的背景声音。我不知道哪种语言是最好的，我完全不知道如何做到这

浏览 33提问于2019-01-29得票数 0

1回答

电报Bot :语音信息音频谱图丢失。窃听器？

api、bots、telegram、waveform、ogg

我正在开发一个电报机器人，我有一个关于发送语音(音频)信息的问题。vbr on -application voip \顺便说一句，MIME类型看起来是正确的：$ file --mime-type -b \ audio/ogg 音频文件按预期正确播放，但我遇到

浏览 0提问于2019-06-04得票数 7

1回答

dfd级别0,1和2之间有什么不同？

difference、dfd

我正在做我的最后一年项目的文档(使用机器学习模型进行cardioVascular风险评估)。COuld任何人请告诉我dfd 0级，1级和2级的区别。提前谢谢

浏览 5提问于2019-06-11得票数 2

1回答

如何在TFS中查看当前迭代中完成工作的百分比？

tfs-2015

我们需要显示一个图表，显示某些项目集合中几个项目的已完成工作的谱图，比如说，众所周知的DefualtCollection.。因此，例如，如果集合中有3个项目，projects 1，2和3，而项目1已完成其任务的30%，2<code>E 211</code>已完成57%，而<code>E 112</code>3<code>E213<&

浏览 2提问于2017-05-09得票数 3

回答已采纳

7回答

如何利用神经网络在音频片段中提取羽毛球射击声音的全部时间戳？

python、machine-learning、audio、deep-learning、librosa

我试图在一场羽毛球比赛的原始音频文件中找到这些例子，其中一次被任何一名球员击中。为了同样的目的，我在时间戳上标上了正面(敲击声)和负面(无撞击声:评论/人群声音等)标签，如下所示：并将其转换为模型的谱图</e

浏览 28提问于2022-11-17得票数 3

2回答

声学指纹的原理是什么？

android、ios、pattern-matching、acoustics

什么样的API或框架被用来分配一个音符的一个值？比如，像Shazzam这样的应用程序如何从麦克风中获取信息，并知道该如何处理它？对我来说，这是惊人的电话，麦克风和一些巧妙的逻辑可以竞争调谐器从一个音乐商店！关于这个主题的有趣的论文。音乐识别应用软件Shazzam基于和的原理下面是中的一些类似代码的示例

浏览 8提问于2016-07-21得票数 1

回答已采纳

2回答

如何找到与示例声音文件最佳匹配的声音文件？

matlab、speech-recognition、spectrogram

例如，一组具有“一”、“二”和“三”的单词，而另一组具有通过单独记录获得的相同的准确单词。许多单词押韵和使用的声音有点不同。到目前为止，我已经尝试过几种方法，但是到目前为止，我得到的最实际的事情是对每个声音文件进行谱图(都是用相同的脚本构建的)。这一切都是通过MATLAB完成的，我只能使用MATLAB。我将把一组录音/光谱图称为“样本集”，而这套录音&

浏览 0提问于2014-01-20得票数 0

回答已采纳

7回答

Ubuntu有免费的实时摄谱仪吗？

sound

在我家里的立体声里，我有一个有二维矩阵的光谱仪，X轴是频率(左是低音，中间是声音，右边是高音)，Y轴是那个频率上声音的体积或功率。我见过这样的Ubuntu，但他们工作的MP3文件或其他预先录制的歌曲。是否有任何东西可以做到这一实时麦克风连接或简单的系统混频器？

浏览 0提问于2013-01-13得票数 21

回答已采纳

1回答

使用FFT匹配两个音频文件(Android )

java、android、android-studio、audio、audio-fingerprinting

在过去的几天里，我一直在开发我的应用程序，我需要同时播放和录制一个音频文件。我需要完成的任务只是将录音与播放的音频文件进行比较，并返回一个匹配的百分比。以下是我到目前为止所做的工作，以及我的问题的一些背景：我决定使用.wav音频文件格式来简化对文件的解码。有没有办法做到这一点，而不保存在用户的</em

浏览 4提问于2017-01-04得票数 2

回答已采纳

点击加载更多