首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >使用python删除重复文件

使用python删除重复文件
EN

Stack Overflow用户
提问于 2012-05-31 21:26:19
回答 2查看 524关注 0票数 0

作为一个个人项目(为了更好地学习python ),我开始了一个重复文件去除器的工作(特别是对于.mp3文件,因为我在试图组织我的完全重复的音乐收藏时想到了它)。现在,我很清楚如何继续,匹配文件名,只删除那些相似度超过0.7的文件,并对相同但名称完全不同的文件使用md5和(例如:"metallica-nothing matters“和"Track1")。问题是,我不知道如何处理那些具有不同名称的文件,它们彼此之间也有一些不同,例如,除了"Track1“在结尾有2秒的静默时间之外,"nothing nothing matters”和"Track1“是相同的。我的问题是:是否有某种方法或算法可以检查文件本身之间的相似性?类似字符串匹配的东西,但是在文件上?如果这是一个复杂的算法并不重要,越难越好,因为我这样做只是为了学习:D

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2012-05-31 21:35:13

你可以使用Chromaprint,它计算一段音乐的指纹。它应该能够找到类似的音乐文件。

如果你想更进一步,你可以使用musicbrainz的接口来找到关于一段音乐的确切信息。

我使用的两个伟大的音乐库标记和排序应用程序都使用了这些库:picardbeets

票数 4
EN

Stack Overflow用户

发布于 2012-05-31 23:30:13

您还可以查看win32模块,这里是链接

http://timgolden.me.uk/python/index.html

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/10834579

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档