腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(5053)
视频
沙龙
1
回答
Librosa
Mel
-频谱
图
日志形状
、
、
、
、
我正在
使用
python中
的
Librosa
从GTZAN数据集中提取
对数
Mel
谱
图
。我
的
代码是-
mel
=
librosa
.feature.melspectrogram(y=data, hop_length = 512//2, n_fft =
浏览 22
提问于2019-11-07
得票数 1
1
回答
在Python中获取
对数
Mel
谱
图
、
、
其他问题,如How to convert a
mel
spectrogram to log-scaled
mel
spectrogram,已经询问了如何在python中获得
对数
缩放
的
mel
谱
图
。我下面的代码生成了上述语
谱
图
ps =
librosa
.feature.melspectrogram(y=y, sr=sr) ps_db=
librosa
.power_to_db(ps, ref=np.max
浏览 97
提问于2020-07-22
得票数 2
回答已采纳
2
回答
对于基于CNN
的
模型,哪个语
谱
图
最能代表音频文件
的
特征?
、
、
、
、
我希望了解音频分析
的
各种频谱
图
。我想将一个音频文件转换为10秒
的
块,为每个块生成光谱
图
,并
使用
CNN模型在这些图像上进行训练,看看它们是好是坏。我已经研究了线性,
对数
,
mel
等,并在某个地方读到基于
mel
的
频谱
图
最适合用于此。但是没有适当
的
可证实
的
信息。我已经
使用
了以下简单
的
代码来生成
mel
谱
图</em
浏览 46
提问于2019-04-04
得票数 0
回答已采纳
1
回答
为什么我
的
8 8kHz文件
的
mel
特征在sr =16 8kHz和44.1kHz中提取不同
、
、
、
我目前正在从我
的
婴儿哭声数据集中提取
mel
特征,wav文件
的
采样率为8 8kHz、16位、单声速和大约7秒。sr =16000时
的
Mel
谱
import
lib
浏览 1
提问于2019-07-16
得票数 6
回答已采纳
1
回答
从频谱
图
时间/频率序列数组中获取MFCC
、
、
我有几个光谱时间/频率500,1024
的
文件。 我需要计算这些文件
的
MFCC。有很多用于计算原始音频文件
的
MFCC
的
库,但我正在寻找python中直接从np.array计算MFCC
的
方法。
浏览 40
提问于2019-06-01
得票数 0
1
回答
从密尔
谱
图中重建音频有一些与
librosa
有关
的
剪辑。
、
、
、
、
我正在做: y=samples, sr=sample_rate, window=print('melspectrogram.shape', melspectrogram.shape) audio_signal =
librosa
.feature.inverse.
mel
_to_audioprint(audio_signal, audio_si
浏览 1
提问于2020-02-23
得票数 0
回答已采纳
2
回答
如何将
mel
谱
图
转换成原形
的
mel
谱
图
、
我正在阅读
使用
卷积神经网络进行环境噪声识别的本论文,并希望复制它们
的
结果。他们将WAV文件转换成日志大小
的
mel
光谱
图
。你是怎么做到
的
?我能够将WAV文件转换成
mel
谱
图
ps =
librosa
.feature.melspectrogram(y=y,
浏览 0
提问于2018-02-09
得票数 4
1
回答
如何将
mel
谱
图
转换成原形
的
mel
谱
图
、
、
、
、
我正在阅读
使用
卷积神经网络进行环境噪声识别的,并希望复制它们
的
结果。他们将WAV文件转换成日志大小
的
mel
光谱
图
。你是怎么做到
的
?我能够将WAV文件转换成
mel
谱
图
ps =
librosa
.feature.melspectrogram(y=y, sr
浏览 1
提问于2018-02-08
得票数 0
3
回答
mel
谱
图
与MFCC
的
区别
、
、
我正在
使用
librosa
库将音乐片段转换为
mel
频谱
图
,以用作我
的
神经网络
的
输入,如文档所示。 这与有什么不同呢?
使用
这两种方法有什么优点或缺点吗?
浏览 5
提问于2018-12-26
得票数 18
1
回答
从FFT数据中创建波形数据?
、
、
、
、
正如您可能注意到
的
,我对python和声音处理非常陌生。我(希望)
使用
python、logfbank和mfcc函数从波形文件中提取FFT数据。( logfbank似乎给出了最有希望
的
数据,mfcc
的
输出对我来说有点奇怪)。到目前为止,这是我
的
浏览 1
提问于2019-07-08
得票数 1
1
回答
Librosa
-如何创建立体声音频
的
mel
谱
图
?
、
、
有一个为单声道音频生成
mel
谱
图
的
代码。import
librosa
,
librosa
.displayimport numpy as np
librosa
.featur
浏览 41
提问于2020-10-19
得票数 0
回答已采纳
1
回答
关于声码器
的
使用
、
、
、
我有一个令人困惑
的
问题,那就是投票人
的
使用
。但是,在其他模型中,如,,,对于wav到
Mel
光谱
图<
浏览 23
提问于2022-02-01
得票数 1
回答已采纳
1
回答
使用
librosa
的
对数
mel
谱
图
、
、
、
我遇到了
使用
librosa
为音频文件生成log-
mel
频谱
图
的
两种不同方法,我不知道它们在最终输出中为什么不同,哪一种是“正确
的
”,或者一种与另一种有多大
的
不同。#1 path = "path/to/my/file"
mel
_spectrogram =
librosa
.feature.melspectrog
浏览 262
提问于2021-05-09
得票数 0
1
回答
Python
Librosa
:用于计算MFCC特征
的
默认帧大小是多少?
、
、
使用
Librosa
库,我将MFCC功能
的
1319秒
的
音频文件生成了一个矩阵20 X 56829。这里
的
20表示MFCC功能
的
编号(我可以手动调整)。但我不知道它是如何将音频长度分割成56829
的
。处理音频所需
的
帧大小是多少?import numpy as npimport
librosa
浏览 3
提问于2016-06-22
得票数 9
回答已采纳
1
回答
音频采样率与音频
的
跳长、滤波长度、窗口长度有什么关系,下采样对音频参数有何影响?
、
、
、
、
我有大约20K文件
的
音频数据,采样率为44100 20K。我正在
使用
这些数据来训练文本到语音
的
塔卡创模型。然而,为成功
的
培训配置
的
参数如下:因此,我需要将数据降到22.5Khz。max_wav_value=32768.0,filter_length=1024,win_length=1024,
mel
_fmin=0.0,
mel
_fmax=
浏览 0
提问于2021-04-19
得票数 0
回答已采纳
1
回答
使用
Librosa
将
Mel
-
谱
图
PNG转换为语音,这有可能吗?
、
、
、
我能把
mel
-
谱
图
png转换成用python(
librosa
,scipy.)声音'wav‘吗?因为我有gan项目来生成
mel
-
谱
图
图像,我不想再把它们转换成声音1-将wav转换成
mel
-
谱
图
,并将结果保存为png。4-
浏览 3
提问于2021-08-07
得票数 0
回答已采纳
1
回答
如何用melspectogram将wav文件转换成RGB图像?
、
、
、
我正在用从1秒到4秒
的
wav文件进行声音分类。我想转换wav到224x224x3图像,我可以收费到Resnet分类,转换应该是
使用
melspectogram谢谢帮助
浏览 112
提问于2019-05-27
得票数 2
回答已采纳
1
回答
如何更改
mel
-spectogram
的
大小?
、
、
、
我想将3个
mel
-spectogram保存到一个png文件。为此,我
使用
了subplots函数。fig, ax = plt.subplots(nrows=3, ncols=1)img2 =
librosa
.display.specshow(S_dB2, sr=sr, fmax=10000, ax=ax[1]) img3 =
librosa
.display.specsho
浏览 0
提问于2020-10-25
得票数 0
2
回答
使用
librosa
函数将语
谱
图
转换为音频
、
、
、
我正在从事语音合成工作,我已经
使用
librosa
构建了频谱
图
。当我想要将频谱
图
转换为音频以保存为wav文件时,它会产生问题。我寻求帮助,发现liborsa有一个函数
mel
_to_audio,但这不起作用。 我
使用
这个函数来获取音频文件
的
频谱
图
。
librosa
.feature.melspectrogram 这是我用来将语
谱
图
转换成音频
的
函数。
librosa
.fea
浏览 284
提问于2019-09-17
得票数 1
回答已采纳
1
回答
用于生物声学机器学习
的
MEL
与线性
谱
图
、
、
、
、
我没有生物声学
的
背景,但从事生物声学
的
数据科学项目。动物是蝙蝠,人们知道它们会发出高频率
的
声音。在背景文献中,我发现
MEL
谱
图
也适用于蝙蝠,并了解到
MEL
谱
图
将范围压缩成
对数
尺度。 但如果是这样的话,我预计信息丢失
的
频率最高,如果是的话,我预计
使用
MEL
的
结果会更
浏览 0
提问于2023-02-28
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
机器学习中的音频特征:理解Mel频谱图
使用python的log函数计算对数
基于神经网络的音乐流派分类
代码详解:用Python给你喜欢的音乐分个类吧
美少女声音之变换合成
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券