我的大容量(120 in )音乐收藏包含许多重复的歌曲,我一直在尝试对曲目进行指纹识别,希望能检测出重复的曲目。因为我是CS专业的,所以我很好奇外面发生了什么?我所做的任何事情都没有像Shazam或Lala.com那样的准确性。他们是如何“散列”曲目的?我对我所有的文件(26,000个文件)运行了一个标准的MD5散列,我在不同的轨道上发现了数百个相等的散列,所以这不起作用。
我对Lala.com更感兴趣,因为他们使用完整的文件,不像Shazam,但我假设两者都使用类似的技术。有人能解释一下如何为音乐生成唯一的标识符吗?
https://stackoverflow.com/questions/2046771
复制相似问题