我在Windows XP计算机上存储了一些备份日志文件,如下所示:
1.txt
2.txt
3.txt
4.txt
5.txt
它们都有1-3个文件大小相同和2-5个文件大小相同的文件。我想存储每个集合中具有相同文件大小的一个,并删除其余的。有人能推荐一个脚本来做这件事吗?
发布于 2011-03-11 13:58:54
来自File::Find::Duplicates的工作示例(稍作调整)可能是一个很好的开始:
use File::Find::Duplicates;
my @dupes = find_duplicate_files('/tmp/dup');
foreach my $dupeset (@dupes) {
printf "Files %s (of size %d) hash to %s\n",
join(", ", @{$dupeset->files}), $dupeset->size, $dupeset->md5;
}
File::Find::Duplicates在大小和MD5校验和上匹配,这可能是您想要的。
https://stackoverflow.com/questions/5268553
复制相似问题