我想知道,在不深入研究PDF智能复制源代码的情况下,什么样的“相同”资源能够被检测和重用。
使用子设置的字体和不同的条形码,我知道这几乎是不可能的,而且PDFSmartCopy没有检测到它。
但是图像和表单呢?它将如何检查“相同”的资源?
有没有人能简单描述一下所使用的启发式方法,以及PDF中的哪种资源被检查?
发布于 2015-09-04 13:18:45
关于这一点有一个iText网站上的回答很棒:
这怎麽可能?PdfSmartCopy获取遇到的每个流对象的散列,并将这些散列保存在内存中。如果PdfSmartCopy检测到您试图两次添加相同的流,则将使用对第一个流的引用,而不是添加冗余流。
https://stackoverflow.com/questions/32394941
复制相似问题