我想知道是否有可能(Quartz2D)以编程方式识别和处理PDF页面中上面(或下面)的文本,该页面显示页码和段落标题或其他信息,以了解您在书中的位置。它只是像页面中的正文一样的文本,还是可以通过某种方式加以区分?
发布于 2012-10-23 00:16:33
页码(如果打印在页面上)与页面上的任何其他文本没有区别(但是PDF文件中还有其他类型的页码)。
某些类型的PDF ( PDF /A-1a,‘标签’PDF)确实会以单独的方式标记页码和标题等内容,但在一般情况下,PDF文件没有这两种标记,并且页码或标题与文本的其余部分无法区分。
https://stackoverflow.com/questions/13008352
复制相似问题