我正在用PHP直接从PDF文件中提取一些低级的图片,因为GhostScript太慢了,而且我做得很好。但问题是,我不知道它在哪里说图片属于哪个页面。从PDF中获取图像没有问题,但弄清楚它们的顺序却有问题。
在PDF数据的什么地方,它说图像应该显示在哪一页上?
发布于 2011-11-28 22:28:17
图像作为独立对象存储在PDF中。它们通过页面的Resources字典、XObject子字典从页面引用。这种关系是页面->资源和图像的关系,所以为了知道图像属于哪个页面,您必须扫描所有页面的所有资源字典,看看您的图像出现在哪个资源字典中。一个图像可以从多个资源字典中引用。这是非常低级的PDF操作,我不知道你在你的代码中有多低级。
https://stackoverflow.com/questions/8297076
复制相似问题