问如何使用Java从PDF中的特定矩形区域提取数据？
EN

Stack Overflow用户

提问于 2017-12-26 08:21:20

回答 1查看 1.6K关注 0票数 3

我试图从PDF中给定的两个坐标指定的特定矩形区域中提取数据。是否可以在PDF中执行此操作，或者我是否必须将其转换为图像并使用OCR？如果有，PDFBox或iText是否包含通过光学字符识别来分析图像的方法？谢谢!

java

pdf

回答 1

Stack Overflow用户

回答已采纳

发布于 2017-12-26 10:58:03

如果区域是文本。使用pdfbox，

PDDocument document = PDDocument.load(new File("target.pdf"));
PDFTextStripperByArea stripper = new PDFTextStripperByArea();
stripper.setSortByPosition(true);
Rectangle rect = new Rectangle(35, 375, 340, 204);
stripper.addRegion("class1", rect);
stripper.extractRegions(document.getPage(1));
System.out.println(stripper.getTextForRegion("class1")

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/47972904

复制

相似问题

问如何使用Java从PDF中的特定矩形区域提取数据？
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何使用Java从PDF中的特定矩形区域提取数据？EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何使用Java从PDF中的特定矩形区域提取数据？
EN