我一直在尝试做一个PDF应用程序中的搜索功能。我阅读了iphone参考库中的Quartz 2d指南。关于"pdf运算符“,人们已经说了很多。通过使用它们,通过使用它们的回调,一切都可以完成。
关于pdf运算符的信息,我们应该阅读adobe的pdf参考。但它非常广阔。谁能告诉我这些运算符是什么(或者如何在研究它们时得到一个概念),以及我的“在pdf中搜索字符串功能”需要使用哪些运算符?
发布于 2010-02-19 00:10:36
发布于 2010-04-26 21:33:10
不要被PDF参考吓跑了。它的布局非常好,你只需要读几章就能理解文本是如何处理的。你可以从Adobe下载
Enrique是正确的,因为TJ和Tj是显示文本的运算符,但在多个操作中拆分单词和句子是完全可能的,甚至是正常的。您可能应该专注于PDF Stream对象中由BT和ET (开始文本/结束文本)标记的文本块。
来自Apache Project的PDFBox是一个功能齐全的库,用于处理PDF文档,请看那里。
发布于 2011-01-11 17:30:57
有四个运算符可以显示文本,即Tj、‘、“和TJ。在设置运算符表时,必须至少转义双引号,如下所示。
CGPDFOperatorTableSetCallback(table, "\"", doubleQuot);
为了确认,我对单引号也做了同样的事情。
如果你仔细阅读了参考文档purecharger中的"9.4.3文本显示操作符“一章,你会发现引号操作符实际上是由多个更简单的操作符组成的,比如Tj,但无论如何你都必须扫描它们,否则你可能会错过一些文本。
所有这些运算符都位于BT上下文中。您已经注意到BT操作符本身没有任何参数,但是如果您跟踪文本矩阵(仅当您想要进行定位时才需要),那么您应该将其设置为单位矩阵。
https://stackoverflow.com/questions/1686924
复制