首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >在不使用MFCC将其转换为模拟信号的情况下,您仍然可以从数字信号中提取特征吗?

在不使用MFCC将其转换为模拟信号的情况下,您仍然可以从数字信号中提取特征吗?
EN

Stack Overflow用户
提问于 2015-05-26 22:59:12
回答 2查看 396关注 0票数 0

我正在开发一个后端语音识别软件,其中用户可以导入mp3文件。如何从这个数字音频文件中提取特征?我是不是应该先把它转换回模拟模式?

EN

回答 2

Stack Overflow用户

发布于 2015-05-26 23:35:11

您的问题不清楚,因为您错误地使用了术语模拟和数字。模拟是真实世界中的连续函数,即电压、压力等。数字是模拟信号的离散(采样)和量化版本。你必须计算你的音频帧的快速傅立叶变换时,计算MFCC的。你只能从数字信号中提取MFCC-这是相当不可能用模拟的。

如果您正在询问是否可以从mp3文件中提取MFCC,那么可以-这是可能的。你所需要做的就是执行标准的算法,然后你就可以得到你的特征了--显然,这超出了这个问题的范围。

通过对样本平方来计算data.

  • Calculate

  • 帧的快速傅立叶变换。

  • 应用mel滤波器组,并将能量的对数与每个对数的对数相加,计算能量的对数。
票数 2
EN

Stack Overflow用户

发布于 2015-05-27 16:20:35

你在这里把事情搞混了,就像@jojek说你可以用数字信号做所有的事情。这是教程中的一个很好的地方:

http://practicalcryptography.com/miscellaneous/machine-learning/guide-mel-frequency-cepstral-coefficients-mfccs/

这个更实用:

http://www.speech.cs.cmu.edu/15-492/slides/03_mfcc.pdf

来自维基百科:[http://en.wikipedia.org/wiki/Mel-frequency_cepstrum]

MFCC通常派生如下:1

傅立叶变换(

  • )对一个信号进行傅里叶变换(有窗口的摘录)。表示短时傅立叶变换)
  • 使用三角形重叠窗口将上面获得的谱的功率映射到mel比例。(在上面的链接中描述的计算)
  • 采用每个mel对数功率的对数frequencies.
  • Take mel对数功率列表的离散余弦变换,就像它是一个信号一样。
  • MFCC是结果谱的振幅。

这里有一个Matlab工具箱,可以帮助你更好地理解它:

http://www.ee.ic.ac.uk/hp/staff/dmb/voicebox/voicebox.html

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/30462170

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档