我需要比较大量的PDF文件的光学内容。由于PDF文件是在不同的平台上创建的,并且软件的版本不同,因此存在结构上的差异。例如:
它应该像人类一样比较内容,而不是内部结构。我想测试我们使用的PDF生成器的不同版本之间的回归。
发布于 2010-02-16 16:34:47
因为没有这样的工具,所以我们已经编写了一个。您可以下载i-net PDF content comparer并使用它。我希望这能帮助其他人解决同样的问题。如果您对它有问题,或者您对我们有反馈,那么您可以联系我们的支持。
发布于 2011-05-03 19:49:16
实际上有一个diffpdf工具。
http://www.qtrac.eu/diffpdf.html
它的缺点是,当添加内容使新文本部分转移到新页面时,它不会做出很好的反应。例如,如果要将旧的第4页与第5页的末尾和第6页的开头进行比较,则需要移动参数以分别比较这两个分片。
发布于 2010-02-10 16:59:39
我使用了一个自制的脚本,
使用的软件:
用于着色、透明度和overlay
优点:
使用的
中的细微差别
缺点:
<
我一直在寻找一个工具,可以做同样的PDF/PostScript级别。
下面是我们的脚本调用实用程序的方式(请注意,ImageMagick在幕后使用GhostScript进行PDF->PNG转换):
$ convert -density 150x150 -fill red -opaque black +antialias 1.pdf back%02d.png
$ convert -density 150x150 -transparent white +antialias 2.pdf front%02d.png
$ composite front01.png back01.png result01.png # do this for all pairs of images
https://stackoverflow.com/questions/145657
复制相似问题