腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
MFCC
系数
的
数量
如何
取决于
文件
的
长度
voice-recognition
、
mfcc
我有一个
长度
为1.85秒
的
语音数据,然后我使用
MFCC
(使用中
的
libraby )提取其特征。它返回184 x 13个特征。我使用10毫秒
的
帧步长,25毫秒
的
帧大小,以及来自DCT
的
13个
系数
。我还是不能理解,因为最后一帧
的
长度
不是25毫秒。有没有什么公式可以解释它
如何
返回184?提前谢谢你。
浏览 50
提问于2018-07-12
得票数 0
1
回答
如何
在Weka中使用
MFCC
进行音频分类?
audio
、
machine-learning
、
weka
、
feature-extraction
、
mfcc
我正在尝试开发一种方法来分类音频使用
MFCC
在Weka。我所拥有的
MFCC
是以1024
的
缓冲大小产生
的
,因此对于每个音频记录都有一系列
MFCC
系数
。我想把这些
系数
转换成Weka
的
ARFF数据格式,但我不知道
如何
处理这个问题。我知道对于ARFF,需要通过属性列出数据。
MFCC
的
每个
系数
是单独<e
浏览 8
提问于2017-07-20
得票数 2
回答已采纳
1
回答
使用
MFCC
系数
进行简单
的
语音活动检测
signal-processing
、
mfcc
由于
MFCC
系数
存储了频带
的
振幅信息(这
取决于
所使用
的
滤波器组),那么
如何
将这些
系数
用于语音活动检测? 使用这些
系数
来执行进一步
的
能量计算并做出决策是否足够?
浏览 2
提问于2016-01-02
得票数 0
4
回答
用于使用librosa进行音频分类
的
MFCC
特征描述符
python
、
audio
、
machine-learning
我正在尝试为音频
文件
获取单向量特征表示,以用于机器学习任务(具体地说,使用神经网络进行分类)。我在计算机视觉和自然语言处理方面有经验,但我需要一些帮助来加快音频
文件
的
速度。音频
文件
有各种各样
的
特征描述符,但
MFCC
似乎是用于音频分类任务最多
的
。我
的
问题是:
如何
获取音频
文件
的
MFCC
表示,它通常是一个矩阵(假设是
系数
矩阵),并将其转换为单个特征向量?我有一堆音频<e
浏览 4
提问于2014-09-23
得票数 13
2
回答
K-均值算法在ASR
MFCC
系数
中
的
应用
speech-recognition
、
k-means
、
speech
、
mfcc
我已经将我
的
音频信号分成20毫秒
的
帧和10毫秒
的
重叠。因此,我有500帧。我已经计算了每一帧
的
MFCC
系数
。我想使用K均值算法对每一帧进行矢量量化。那么我该
如何
继续呢?是否采用相邻帧并将K均值应用于相邻帧?
浏览 1
提问于2017-03-12
得票数 0
1
回答
Mel
mfcc
的
组成部分是什么?
librosa
、
mfcc
在查看这一行代码
的
输出时:print("
MFCC
Shape = ", mfccs.shape) 我得到了
MFCC
Shape = (40,1876)
的
回复。任何见解都将受到极大
的
赞赏!
浏览 0
提问于2020-12-08
得票数 1
回答已采纳
1
回答
如何
为CNN输入python制作三维数组
python
、
arrays
、
multidimensional-array
、
conv-neural-network
、
mfcc
我正在尝试学习cnn网络来识别语音中
的
情感。为此,我使用了mel倒谱
系数
(
mfcc
),它将每个音频
文件
表示为二维数组(帧数*
mfcc
系数
数)。我想有一个三维数组作为我
的
cnn卷积层
的
输入,其中第三维是音频
文件
的
数量
。怎样才能得到这样
的
数组呢?range(len(audio_list)): (rate,sig) = wav.read(source_folder +
浏览 33
提问于2019-05-25
得票数 1
1
回答
Pybrain中
的
单词分类:输入向量中
的
不同序列数
neural-network
、
pybrain
我正在尝试使用PyBrain实现一个简单
的
单数分类器。我有许多有记录
的
数字0到9
的
训练数据,并编写了一个脚本来提取每个例子
的
MFCC
。为了保持简单(目前),我只计算了13个
系数
,并且每10毫秒采样一次音频
文件
。由于每个记录
的
培训示例都具有不同
的
持续时间,所有“零”集
的
样本数,例如,每个“零”
的
样本数,
取决于
音频
的
长度
。因此,对于一些“零”
浏览 1
提问于2012-10-04
得票数 0
0
回答
mfcc
特征大小
如何
影响递归神经网络
python
、
machine-learning
、
recurrent-neural-network
、
mfcc
、
librosa
所以我在学习机器学习,想知道
mfcc
特征大小对RNN (递归神经网络)有什么影响?使用librosa,我提取了
mfcc
,然后是增量
系数
,然后我得到了维数为13
的
数组,sound_length
mfcc
= librosa.feature.
mfcc
(y=y, sr=sr, n_
mfcc
=13)
浏览 3
提问于2017-01-10
得票数 4
2
回答
MFCC
特征向量与DTW
的
比较
audio
、
speech-recognition
、
dynamic-programming
、
mfcc
、
dtw
我正在寻找一些关于动态时间弯曲(DTW)
的
建议。例如,一个.WAV
文件
可以由包含10组12个特征向量
的
数组来表示,而另一个.WAV
文件
可以由一个包含20组12个特征向量
的
数组来表示。我打算使用D
浏览 37
提问于2018-01-16
得票数 5
回答已采纳
3
回答
基于
mfcc
和动态时间规整(dtw)
的
声音分类
mfcc
我
的
目标是在java中使用
mfcc
和dtw对非语音信号进行分类。然而,我被卡在了中间。如果有任何帮助,我将不胜感激。我已经为每个帧评估了13个
mfcc
值,但是有些值是负值,我很困惑我所遵循
的
过程是正确
的
还是错误
的
。目前我使用
的
是JAudio提供
的
代码。我也尝试过其他代码,它们也给了我负值。其次,对于每一帧,我得到了13个
系数
,考虑到一定
长度
的
样本
的
157帧,我得到了157组13个<
浏览 1
提问于2012-07-17
得票数 2
回答已采纳
1
回答
生成python中每个
MFCC
系数
的
直方图图
python-3.x
、
histogram
、
librosa
、
mfcc
如何
在python中为从音频
文件
中提取
的
每个
MFCC
系数
生成直方图图。如图所示,从实现中可以导出每个Matlab
系数
的
直方图:我怎样才能在python中实现同样
的
情节呢?我使用librosa作为
MFCC
的
特征提取。下面是我
的
MFCC
特性提取代码:import librosa.displayimpor
浏览 9
提问于2022-08-16
得票数 0
回答已采纳
2
回答
如何
使用C#提取
MFCC
c#
我正在做一个个人项目,它需要我在C#中做一些信号处理和特征提取,更具体地说,提取,有没有在C#中计算
MFCC
的
可用代码?此外,如果有任何为其他语言(Objective-C,C,C++,甚至Java)写得很好
的
东西,我想我能够得到这个想法,并用C#重写它。
浏览 3
提问于2010-10-19
得票数 5
1
回答
Keras SimpleRNN型
MFCC
矢量
python-3.x
、
keras
、
recurrent-neural-network
我目前正试图在Keras中实现一个递归
的
神经网络。该数据由45.000个集合组成,其中每个条目都是(可变
长度
的
)
MFCC
向量
的
集合,每13个
系数
:print(spoken[0])..]print(spoken.shape) # Gives: (45000,0) print(spoken[0].shape) # Gives (N, 13) --> N amount of
MFCC
浏览 0
提问于2018-03-22
得票数 0
回答已采纳
1
回答
语音情感识别中
的
MFCC
( Mel频率
系数
平均值对性能
的
影响)
signal-processing
、
speech-recognition
、
feature-extraction
、
feature-selection
、
mfcc
我正在做一个项目(从语音或语音音调中检测情感),我正在使用
MFCC
,我在一定程度上理解了这一点,并且知道它们在语音方面是非常重要
的
。这是我从librosa使用
的
代码,用于从我
的
音频
文件
中提取特征,然后在神经网络中用于培训:mfccs = np.mean(librosa.feature.
mfcc
(y=dat, sr=sample_rat
浏览 1
提问于2021-02-11
得票数 1
回答已采纳
1
回答
MFCC
生成解析wav
文件
的
"ValueError: index不能包含负值“。
python
、
audio
、
mfcc
如何
使用通用代码提取缩放
的
MFCC
数据:try: mfccs = librosa.feature.
mfcc
(y=audio, sr=sample_rate, n_
mfcc
=40) mfccsscaledprint("Error encountere
浏览 6
提问于2020-12-05
得票数 1
回答已采纳
1
回答
Matlab中
MFCC
系数
的
一阶导数
matlab
、
signal-processing
、
feature-extraction
、
audio-processing
、
mfcc
我已经提取了mel频率倒谱
系数
(
MFCC
)特征(在Matlab中)用于一些语音分类。我目前正在考虑添加
MFCC
系数
特征
的
一阶和二阶导数。我们
如何
从
MFCC
得到一阶和二阶导数? 提前感谢
浏览 8
提问于2019-11-30
得票数 0
2
回答
如何
将
MFCC
系数
应用于DTW
speech-recognition
、
mfcc
我正在尝试实现一个使用Mel频率倒谱
系数
(
MFCC
)和动态时间规整(DTW)
的
语音识别模块。所以我有一个M x N矩阵。
浏览 4
提问于2017-02-18
得票数 1
1
回答
如何
从
MFCC
中选择20个值?
wolfram-mathematica
、
mfcc
我是Mathematica 11.3
的
用户。为了制作一个用于乐器识别的分类器,我需要音乐数据集中
的
MFCC
值。我从伊尔马斯那里拿到了数据。音乐
的
长度
从5秒到20秒不等。
如何
在分类器中获得输入数据集
的
20个值?通常,我得到
的
是{2389,13}矩阵。enc=NetEncoder["AudioMFCC"
浏览 0
提问于2018-12-01
得票数 0
1
回答
如何
从
mfcc
系数
中提取特征
speech-recognition
、
feature-extraction
、
mfcc
我已经成功地提取了
MFCC
系数
,并得到了以下值 6.4996 0.2495 0.9815 0.0075 -0.2038 0.2084 0.8877现在
如何
从这些值中提取特征
浏览 3
提问于2014-03-18
得票数 0
点击加载更多
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
腾讯会议
活动推荐
运营活动
广告
关闭
领券