首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >无法使用iText读取PDF文档的某些部分

无法使用iText读取PDF文档的某些部分
EN

Stack Overflow用户
提问于 2017-11-08 21:59:40
回答 1查看 146关注 0票数 0

我有一堆PDF文档,我通常能够使用iText.Kernel.Pdf.Canvas.Parser.PdfTextExtractor.GetTextFromPage方法读取所有文档。

有些文件中有一段没有阅读的文本。在所附的图片中,我无法阅读被黄色包围的区域中的文本。

我猜,这是实体不是图片,因为我无法复制粘贴使用鼠标。此外,我能够通过处理自定义策略对象中的EventType.RENDER_IMAGE来读取文档中的图像。并且,包围区域不被提取为图像。

关于如何阅读这篇文章,有什么建议吗?

谢谢你,秀

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-04-16 21:44:30

如果您没有获得该内容的RENDER_TEXTRENDER_IMAGE事件,则很可能使用矢量图形说明绘制该事件。

您也可以检索这样的指令,但是您得到的是一系列路径定义(移动到,线到,曲线到,.)和路径绘制(笔画,填充,.)信息作为RENDER_PATH事件。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/47190420

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档