作为一个个人项目(为了更好地学习python ),我开始了一个重复文件去除器的工作(特别是对于.mp3文件,因为我在试图组织我的完全重复的音乐收藏时想到了它)。现在,我很清楚如何继续,匹配文件名,只删除那些相似度超过0.7的文件,并对相同但名称完全不同的文件使用md5和(例如:"metallica-nothing matters“和"Track1")。问题是,我不知道如何处理那些具有不同名称的文件,它们彼此之间也有一些不同,例如,除了"Track1“在结尾有2秒的静默时间之外,"nothing nothing matters”和"Track1“是相同的。我的问题是:是否有某种方法或算法可以检查文件本身之间的相似性?类似字符串匹配的东西,但是在文件上?如果这是一个复杂的算法并不重要,越难越好,因为我这样做只是为了学习:D
发布于 2012-05-31 21:35:13
你可以使用Chromaprint,它计算一段音乐的指纹。它应该能够找到类似的音乐文件。
如果你想更进一步,你可以使用musicbrainz的接口来找到关于一段音乐的确切信息。
我使用的两个伟大的音乐库标记和排序应用程序都使用了这些库:picard和beets。
发布于 2012-05-31 23:30:13
您还可以查看win32模块,这里是链接
http://timgolden.me.uk/python/index.html
https://stackoverflow.com/questions/10834579
复制相似问题