首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

使用 Apache PDFBox 操作PDF文件

Apache PDFBox还包括几个命令行实用程序。 Apache PDFBox的主要功能如下: 从PDF文件中提取Unicode文本。 将单个PDF拆分成多个文件或合并多个PDF文件。...从PDF表单中提取数据或填写PDF表单。 验证PDF文件是否符合 PDF/A-1b 标准。 使用标准的Java打印API打印PDF文件。 将PDF另存为图像文件,例如PNG或JPEG。...>pdfbox 2.0.28 这里使用的版本是:2.0.28。...创建PDF文档 我们可以使用以下代码创建一个简单的PDF文档: import java.io.File; import java.io.IOException; import org.apache.pdfbox.pdmodel.PDDocument...插入图片 我们可以使用以下代码在PDF文件中插入图片: import java.io.File; import java.io.IOException; import org.apache.pdfbox.pdmodel.PDDocument

2.3K20
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    java 往 pdf 插入数据 (pdfbox+poi)

    指定页码插入/替换 pdfbox好像没有专门提供这个方法,但是现有的方法多重组合起来也能实现这个功能, 需求:一个pdf文件A有10页,现在想在第6页插入一页新的pdf文件B,插入完成后整个pdf文件A...思路2(替换):   在插入的基础上,拆分的时候将pdf文件A里面的第6个页丢弃,使用新的页面来代替它命名6.pdf,然后合并就完事了。 1.pom pdfbox--> org.apache.pdfbox pdfbox-toolspdf,或者使用打印另存为pdf的时候,纸张大小就那么几类(A4/A3等),那我就不干了啊,丑里吧唧的。...2、这个时候就用pdfbox的图片插入功能:将图片写入原来的6.pdf这一页里面来,你要问我为啥?因为原来的6.pdf尺码是对的,其中画图的时候开始位置x,y都从0开始。

    1K30

    五分钟实现pdf分页

    对于pdf文件,也同样有apache的pdfbox(官网:https://pdfbox.apache.org/),和itextpdf(官网:https://itextpdf.com/)包可以使用。...PDFBox: PDFBox 是 Java 实现的 PDF 文档协作类库,提供 PDF 文档的创建、处理以及文档内容提取功能,也包含了一些命令行实用工具。...依赖引入 新建一个java maven工程,引入依赖包(这里使用的是itextpdf的5.5.1 和 pdfbox的2.0.15版本): 使用的是itextpdf,代码如下: /** * 导出pdf文档中的部分页到新的pdf文件 * @param filePath 文件路径 * @param newFile 写入目标文件路径...: 读取pdf文件内容 使用pdfbox的pdfparser,代码如下: /** * 读取pdf文档指定页数的文本内容 * @param fileName 文件路径及文件名 * @

    1.9K20

    操作 PDF 文件的常用JAR包

    操作PDF在很多业务场景都要用到,例如电子发票,电子处方笺。为什么需要使用PDF呢?...因为之前小编在做电子处方笺时,对比使用了 iText 和 Apache PDFBox(接下来要介绍的一款JAR包)。...0x03:Apache PDFBox Apache PDFBox库是用于处理PDF文档的开源Java工具。该项目允许创建新的PDF文档,操纵现有文档以及从文档中提取内容的功能。...仓库 https://github.com/LibrePDF/OpenPDF 0x05:x-easypdf x-easypdf基于pdfbox构建而来,极大降低使用门槛,以组件化的形式进行pdf的构建...仓库 https://gitee.com/xsxgit/x-easypdf 总结:操作PDF的JAR主要分成两类,分别是iText系列和Apache PDFBox系列,在之前的项目中使用PDF操作工具遇到不少的坑

    2.6K20

    PDF文档的自动化测试

    测试合同内容填充数据正确性(填充数据与数据库数据一致性) 场景二:合同/签章部分代码改动,原有多产品线的合同/签章需要回归测试,验证与基线代码下的合同内容一致 2.2、设计思路: 场景一:最直接的方案是引入外部jar包,如PDFBox...( https://pdfbox.apache.org/index.html)。...PDFBox是Apache下的一个开源项目,我们可以通过 PDFBox读取、创建PDF文档,加密/解密PDF文档,从PDF和XFDF格式中导入或导出表单数据 等,实现代码如下: private static...; } return sb.toString(); } } return null;} 问题:经测试使用...,PDFBox提取出来的仅是文字流,而不是带有格式、顺序、标题的文档,经过PDFBox输出的字符串,我们仍需要全篇进行解析,处理并提取其中的关键字与填充信息,这样做很费劲而且不优雅。

    1.8K20

    java PDF开源库选择与iText发展历史

    越来越多的电子图书、产品说明、公司文告、网络资料、电子邮件在开始使用PDF格式文件。 总结一下就是PDF是一种文件格式,只要按照这种文件格式谁都能创建、阅读和编辑PDF文档。...使用iText与PDF能够使你正确的控制Servlet的输出。 PDF Box 1958 PDFBox是一个Apache开源的x项目。可以操作PDF文档的Java PDF类库。...-1b标准 使用标准Java打印API打印PDF文档 另存为图片文件,如PNG、JPEG 使用内嵌字体和图片从头创建PDF 电子签名PDF文件 iText: PDFBox里面的特性iText都有 iText...参考资料 [1] PDF百度百科词条 [2] PDF文件的读写(使用SDK)....– iText vs Apache FOP [5] Java操作pdf>>>pdfBox使用体验 [6] Apache PDFBox官网 [7] iText in your dociment workflow

    7K30
    领券