大家好,在一个主要工作是pdf编辑的应用程序上工作。
我知道苹果不提供任何api来编辑pdf。但是我的需求是这样的。
因此,我想提取整个pdf文件的内容,并在编辑后创建一个新的pdf。现在我需要知道如何提取pdf格式(页眉,页脚,图像,突出显示。,,)
我正在使用Tj运算符来提取pdf文本。我应该使用哪些运算符来提取pdf文件的其他信息。
提前谢谢。
发布于 2011-08-04 17:00:07
使用Do操作符在页面上绘制图像。它的操作数是资源字典中的图像名称。Do操作符还绘制表单XObjects (自包含矢量图形),这些内容也存储在资源字典中。图像/表单XObject字典中的子类型键为您提供对象类型:"Image“表示图像," form”表示form XObjects。
其他元素是纯矢量图形和文本,PDF文件没有页眉、页脚、段落等作为独立对象。您在视觉上看到的页面页眉,在PDF文件内部只是绘制在页面顶部的纯文本。
高亮显示可以是普通的半透明黄色矩形(与页面上的其他矩形没有什么不同),也可以是高亮显示注释(在页面的Annots数组中提供)。
https://stackoverflow.com/questions/6938495
复制相似问题