首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

使用 Apache PDFBox 操作PDF文件

简介 Apache PDFBox库是一个用于处理PDF文档开源Java工具。该项目允许创建新PDF文档,操作现有PDF文档,并从PDF文档中提取内容。...Apache PDFBox还包括几个命令行实用程序。 Apache PDFBox主要功能如下: 从PDF文件中提取Unicode文本。 单个PDF拆分成多个文件或合并多个PDF文件。...创建PDF文档 我们可以使用以下代码创建一个简单PDF文档: import java.io.File; import java.io.IOException; import org.apache.pdfbox.pdmodel.PDDocument...然后,我们使用drawImage()方法在PDF文档指定位置插入了图像。 最后,我们修改后文档存到名为“one-more-jpg.pdf新文件中,并关闭文档。...如果存在,则我们遍历它们,并使用PDImageXObject对象获取它们属性,例如宽度和高度。 然后,使用ImageIO把图片保存到本地文件系统。

1.4K20
您找到你想要的搜索结果了吗?
是的
没有找到

java 往 pdf 插入数据 (pdfbox+poi)

拆分到第6页时候文件B放进来,重命名问6.pdf,原本pdf文件A里面的第6页重命名为7.pdf,依次后推,最后得到1.pdf----->11.pdf一共11个文件   然后使合并功能将这个11...思路2(替换):   在插入基础上,拆分时候pdf文件A里面的第6个页丢弃,使用页面来代替它命名6.pdf,然后合并就完事了。 1.pom org.apache.pdfbox pdfbox-tools</artifactId...,比如这里第6页,然后(我这个整页都是图片)内容修改后,合并进来发现尺码不对,是的,你没有听错就是尺码不对,当我修改后pdf在放进来合并时候,这一页它变小了~,原来是我在图片另存为pdf,或者使用打印另存为...2、这个时候就用pdfbox图片插入功能:图片写入原来6.pdf这一页里面来,你要问我为啥?因为原来6.pdf尺码是对,其中画图时候开始位置x,y都从0开始。

97130

java PDF开源库选择与iText发展历史

PDF Box 1958 PDFBox是一个Apache开源x项目。可以操作PDF文档Java PDF类库。它可以创建一个新PDF文档,操作现有PDF文档并提取文档内容。...但最新版本它可以xml文件转换成pdf,mif,pcl,txt等多种格式以及直接输出到打印机,并且支持使用SVG描述图形 gnujpdf 782 gnujpdf是一个java类包(gnu.jpdf....除去JFreeRport(因为不能操作原生PDF,依赖于报表)以外,最火热就是iText和Apache PDFBox和FOP了(Apache毕竟厉害),所以让我们来看一下他们比较。...-1b标准 使用标准Java打印API打印PDF文档 另存为图片文件,如PNG、JPEG 使用内嵌字体和图片从头创建PDF 电子签名PDF文件 iText: PDFBox里面的特性iText都有 iText...– iText vs Apache FOP [5] Java操作pdf>>>pdfBox使用体验 [6] Apache PDFBox官网 [7] iText in your dociment workflow

5.5K30

OpenSource - 文件在线预览模块(多格式转 PDF 文件)

2023新增说明: 《文档转换预览技术说明》:https://www.yuque.com/hcwdc/open/pos2lih1vi3248g9 已经部分教程进行了整合优化,放到了语雀平台上,原先老教程依然可以看...文件转图片 ps:会先将文件转为 pdf,然后使用 pdfbox 转为图片 http://ip:port/demo/toPng 文件转SVG ps:会先将文件转为 pdf,然后使用 pdfbox...PDF 部分采用了LibreOffice工具 PDF 转换图片使用PDFBox组件 感谢hutool组件 项目关联关键词 word 转 pdf、word 转图片、office 格式转换、在线文件预览...缺点:同步转换容易造成页面卡顿,转换时间超长情况下,系统接口会超时。 异步转换 即用户上传文档提交接口瞬间,系统不会立即进行转换,而是文档放入转换队列,由后台转换进程进行转换。...主要技术 名称 用途 地址 Libreoffice office转pdf https://zh-cn.libreoffice.org/ PDFBox pdf转图片 https://pdfbox.apache.org

7500

Java 解析pdf文档内容实战案例

一、应用场景 1.首先我个人认为一切技术都是为了服务实际业务场景,所以说业务场景很重要,我一般写文章也都是先说明我业务场景,这样大家也应该会比较容易理解,能知道我们为什么要解析这个pdf文档内容...3.咱么既然要解析PDF文档内容,肯定是想把它解析成格式化数据(JSON)格式,对吧,这样才能方便我们对数据一个使用。 二、直接上代码 具体基本每一行,我都有详细注释说明。...-- https://mvnrepository.com/artifact/org.apache.pdfbox/pdfbox --> org.apache.pdfbox...-- pdfbox end --> 注:我这里还有对PDF文档其他一些解析,包括html字符串生成PDF文档实际应用需求,所以我这儿引入包比较多一点儿,你可以根据自己需求,按需引入依赖包。 ...", "E:\\www\\temp\\cxkxj_xzls.txt"); } /** * 测试解析pdf文档内容,并将解析内容输出到Txt文档中 * 正式使用时,无需将解析后内容写入文件

1.8K30

PDF文档自动化测试

,原有多产品线合同/签章需要回归测试,验证与基线代码下合同内容一致 2.2、设计思路: 场景一:最直接方案是引入外部jar包,如PDFBox( https://pdfbox.apache.org/...PDFBoxApache一个开源项目,我们可以通过 PDFBox读取、创建PDF文档,加密/解密PDF文档,从PDF和XFDF格式中导入或导出表单数据 等,实现代码如下: private static...,PDFBox提取出来仅是文字流,而不是带有格式、顺序、标题文档,经过PDFBox输出字符串,我们仍需要全篇进行解析,处理并提取其中关键字与填充信息,这样做很费劲而且不优雅。...另外一种实现思路是文档转为有标记文档,比如xml、html,这样的话在完成转化后我们就可以通过标签快速找到想要元素并进行后续操作。...经调研,转化PDF文档外部库很多,这里我们选择itextpdf。

1.8K20

java 打印pdf_java打印pdf文件

2.3.2 先将word转化为pdf文件,然后打印pdf(lz使用) 三、总结 ---- 一、Java打印简介 在我们实际工作中,经常需要实现打印功能。...文件格式打印实现 在经过网上查找及对比,我选择了使用Apache PDFbox来实现进行PDF文件格式打印。...Apache PDFbox是一个开源、基于Java、支持PDF文档生成工具库,它可以用于创建新PDF文档,修改现有的PDF文档,还可以从PDF文档中提取所需内容。...Apache PDFBox还包含了数个命令行工具。在此,我们只研究打印功能。 优点:功能强大,开源软件,较完美的解决了PDF格式文件一系列处理,使用方便。...②打印pdf文件时,使用是上面讲述pdfbox插件,所以也需要引入pdfbox依赖 org.apache.pdfbox</groupId

5.2K20

java 利用 pdfbox 实现PDF转为图片

; import org.apache.pdfbox.rendering.ImageType; import org.apache.pdfbox.rendering.PDFRenderer; import...: * 1.如何解决 Linux 环境下乱码问题:重写 UnixFontDirFinder 类,修改 Linux 环境下获取字体文件路径,改为取项目里字体文件(使用 pdfbox 转图片时方法...,使用 icepdf 请自行研究) * 2.如果后续遇到乱码问题,查看日志看看缺少什么字体,然后字体文件上传到项目的 src/main/resources/fonts 目录下即可...转图片,demo * (使用 pdfbox) * @param pdfPath PDF路径 * @imgPath img路径 * @page_end 要转换页码...转化为图片 * (使用 pdfbox) * @param pdDocument PDF对象 * @param page_end 要转换页码,发票一般是一页,取第一页

3.4K10

PDF转Word完全指南:3大方法满足各种场景!

还不知道PDF怎么转Word吗,本文提供完整PDF转Word方案,包括离线、在线或者SDK API等各种方式,总有一款满足您需求。什么是PDF转Word?...PDF是出版和图形领域软件厂商Adobe制定电子文档格式标准。PDF转Word就是把PDF文档文字,图片,表格,注释等等文档元素相对应转换成Word文档中相对应文档元素。...目前PDF处理类库较多,我们选择几个有代表来说下。开源类库pdfbox Java类库PDFBox是一个BSD许可下源码开放项目,为开发人员读取和创建PDF文档而准备纯Java类库。...地址在 https://pdfbox.apache.org/ 社区比较活跃,更新速度较快代码示例import org.apache.pdfbox.pdmodel.PDDocument;import org.apache.pdfbox.text.PDFTextStripper...通过iText不仅可以生成PDF或rtf文档,而且可以XML、Html文件转化为PDF文件。

4.3K40

一些好用开源控件

我曾经自己过日志工具,日志写在服务器某个文本文件中,但总是因为文本写入异常出现各种各样错误。...是我用过做好用缩图工具。使用.net自带图片处理类实现缩图功能,总是感觉缩出来图片有些毛刺。下面附上代码。.../Files/lts8989/lucene.rar 官网地址:http://lucene.apache.org/ 五、PDFBox读取PDF文件       好多对pdf操作工具都是创建pdf文件,...读取pdf工具有PDFBox和iTextSharp,有网友推荐使用iTextSharp,我在项目中使用PDFBox,个人感觉这个工具效率很低。...PDFBox是一个java源码编译成.netdll文件工具(看到此处时候我也感到很神奇)。以下地址不太详细介绍了PDFBox和iTextSharp使用

1.6K60

Java必知必会常用类库

Java是一个开源世界,如果你不懂在网上寻找适合轮子,而是经常避免造成,你无法再代码泥潭里解脱出来。但是这也不是一概而论。...例如Dom4j、JDOM、JAXB 、XStream等,每个类库都有自己优点,在项目中可以按照需求挑选合适类库。 ? 3、PDF类库 市面上处理PDF主要有PDFBox和iText这两个类库。...PDFBox是开源组织Apache项目,是不收费;但是iText如果生成上使用时需要购买版权。两者比较PDFBox功能相对比较弱,iTex功能非常强大,可以直接在PDF里作图。...这个也是Apache子项目,功能非常强大,还可以操作电子文档Word。 ? 5、JSON类库 现在JSON格式报文越来越流行,JAVA领域处理JSON格式报文类型非常多。...7、Apache各种Common包 Apache提供了一系列Common包,包括日志common-logging日志类库、common-lang处理java.lang包下类库、common-collections

65610
领券