首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >如何使用Java从PDF中的特定矩形区域提取数据?

如何使用Java从PDF中的特定矩形区域提取数据?
EN

Stack Overflow用户
提问于 2017-12-26 08:21:20
回答 1查看 1.6K关注 0票数 3

我试图从PDF中给定的两个坐标指定的特定矩形区域中提取数据。是否可以在PDF中执行此操作,或者我是否必须将其转换为图像并使用OCR?如果有,PDFBox或iText是否包含通过光学字符识别来分析图像的方法?谢谢!

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2017-12-26 10:58:03

如果区域是文本。使用pdfbox

代码语言:javascript
运行
复制
PDDocument document = PDDocument.load(new File("target.pdf"));
PDFTextStripperByArea stripper = new PDFTextStripperByArea();
stripper.setSortByPosition(true);
Rectangle rect = new Rectangle(35, 375, 340, 204);
stripper.addRegion("class1", rect);
stripper.extractRegions(document.getPage(1));
System.out.println(stripper.getTextForRegion("class1")
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/47972904

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档