给定两个数字格式的录音,有没有一种算法可以比较这两个声音并返回一个相似系数?
发布于 2010-05-11 15:52:53
有许多不同的算法-这个任务的通用名称是Speaker Identification
-从这个维基百科页面开始,并从那里开始:http://en.wikipedia.org/wiki/Speaker_recognition
发布于 2010-05-11 16:03:16
我不确定这是否适用于声音文件,但我希望它能给你一个如何进行的想法。这是在另一个图像中查找模式(图像)的基本方法。
首先必须计算两个声音文件的fft,然后进行相关。在formular中,它看起来像(伪代码):
fftSoundFile1 = fft(soundFile1);
fftConjSoundFile2 = conj(fft(soundFile2));
result_corr = real(ifft(soundFile1.*soundFile2));
其中fft=快速傅立叶变换,ifft =逆,conj =共轭复数。对声音文件的样本值执行fft。然后,result_corr向量中的峰值将为您提供高度相关的位置。请注意,在这种情况下,两个声音文件必须具有相同的大小-否则您必须将较短的一个放入最大(SoundFileLength)矢量的文件中。
问候
编辑:.*意味着(在matlab风格中)一个组件式的乘法,你不能做向量乘法!Next Edit:请注意,您必须对复数进行操作-但是有几个复杂的类,所以我认为您不必为此而烦恼。
https://stackoverflow.com/questions/2808876
复制相似问题