我需要跟踪收到的PDF文档。我可以在数据库中保存文档的列表,但是有时文档会被重命名或移动,因此PDF的文件路径并不总是可靠的。对于其他文档类型,我有时会添加一个惟一的ID作为元数据,这样我就可以识别出移动和/或重命名的文件与以前看到的文件相同。我正在寻找一个解决方案,将在Windows10上工作,并希望基于Node.js的解决方案,虽然Python也可以接受。这些文档来自许多不同的来源,我没有要求文档的来源添加唯一标识符的选项。我曾经以这种方式对媒体文件使用过IPTCinfo,但(据我所知)这不能用于PDF。我正在寻找类似的东西,可以与PDF一起使用。
发布于 2020-12-31 18:36:55
使用md5sum
import os
def check_md5sum(file_path):
md5sum = os.system(f'md5sum {file_path}')
return md5sum
https://stackoverflow.com/questions/65519625
复制相似问题