开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

如何更改现有PDFBox文档中的字体或编码

PDFBox是一个用于处理PDF文档的Java库。要更改现有PDFBox文档中的字体或编码，可以按照以下步骤进行操作：

导入PDFBox库：首先，确保已将PDFBox库添加到您的Java项目中。您可以从Apache PDFBox官方网站（https://pdfbox.apache.org/）下载最新版本的库，并将其添加到您的项目中。
打开现有文档：使用PDFBox库的PDDocument类，您可以打开现有的PDF文档。使用以下代码打开文档：

PDDocument document = PDDocument.load(new File("path/to/existing/document.pdf"));

获取页面内容：使用PDDocument类的getPage方法，您可以获取PDF文档的页面。例如，要获取第一页的内容，可以使用以下代码：

PDPage page = document.getPage(0);

获取页面内容流：使用PDPage类的getContentStream方法，您可以获取页面的内容流。内容流是一个PDPageContentStream对象，它允许您在页面上进行绘制操作。例如，要获取第一页的内容流，可以使用以下代码：

PDPageContentStream contentStream = new PDPageContentStream(document, page);

更改字体或编码：要更改文档中的字体或编码，您需要使用PDType0Font类。该类允许您加载自定义字体，并将其应用于文档中的文本。以下是一个更改字体的示例代码：

PDType0Font font = PDType0Font.load(document, new File("path/to/custom/font.ttf"));
contentStream.setFont(font, 12);

在上面的示例中，我们加载了一个自定义字体文件，并将其应用于文档中的文本。您可以根据需要更改字体的大小和样式。

保存更改并关闭文档：完成对文档的更改后，使用PDDocument类的save方法将更改保存到新的PDF文件中。然后，使用close方法关闭文档。以下是保存和关闭文档的示例代码：

document.save(new File("path/to/modified/document.pdf"));
document.close();

通过按照上述步骤，您可以使用PDFBox库更改现有PDF文档中的字体或编码。请注意，PDFBox还提供了许多其他功能，例如文本提取、图像处理等，您可以根据需要进一步探索。

腾讯云相关产品和产品介绍链接地址：

腾讯云对象存储（COS）：https://cloud.tencent.com/product/cos
腾讯云云服务器（CVM）：https://cloud.tencent.com/product/cvm
腾讯云人工智能（AI）：https://cloud.tencent.com/product/ai
腾讯云区块链（BCS）：https://cloud.tencent.com/product/bcs
腾讯云音视频处理（VOD）：https://cloud.tencent.com/product/vod
腾讯云物联网（IoT）：https://cloud.tencent.com/product/iot
腾讯云移动开发（MPS）：https://cloud.tencent.com/product/mps

相关搜索:PdfBox -更改pdf文件中的字体或fontName？PdfBox -更改矩形中的字体颜色 pdfbox：...在此字体的编码中不可用如何在PDFBOX中获得正确的字体大小更改Word文档中的文本字体颜色 PDFBox接口:如何更改字体以处理AcroForm字段中的西里尔字值如何使用docx更改特定段落的字体(它正在更改整个word文档的字体)如何使用PDFBox将标准字体嵌入到生成的PDF中更改Pandoc生成的PDF文档中的字体大小如何更改PhpStorm中的编码？如何更改字段中的现有属性如何更改PreText或段落小工具的字体？如何找出引用的字体以及嵌入在PDF文档中的字体如何更改R标记文档中间的字体大小和类型？iText 7如何设置中整个文档的字体替换或更改Angular 8/9中现有的或旧的组件前缀？如何更改DatePicker - React Native的字体系列或大小使用lotus脚本或@命令更改字段中的字体颜色如何更改Thingsboard中的现有别名如何在R中更改绘图的字体？

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

使用 Apache PDFBox 操作PDF文件

Apache PDFBox库是一个用于处理PDF文档的开源Java工具。该项目允许创建新的PDF文档，操作现有PDF文档，并从PDF文档中提取内容。Apache PDFBox还包括几个命令行实用程序。

02

为何选择iText？java PDF开源库选择与iText发展历史

转眼间，我写iText7系列已经有一年多了，还记得最开始的时候是因为兴趣才翻译iText，不过随着慢慢翻译文章才发现iText的强大之处，最近也是调研了整个java PDF开源库的生态圈，我给大家详细讲一下java PDF开源库的选择还有我选择iText的理由。

03

OpenSource - 文件在线预览模块（多格式转 PDF 文件）

本地启动后访问页面地址为：http://localhost:8301/index

00

Word自动化(C# + Python)(持续更新中...)

前言 Word就是那种很难用, 很丑陋, 但是你不得不用的东西, 在这一点上, 它甚至比Windows更甚。 Windows可以用macOS + PlayStation进行1000%的替代。但是Office不能够, 并不是没有比Office更好的东西, 这是一个历史残留问题, 就像牙膏厂CPU里面, 那些莫名其妙的字段一样。总之, 这里通过使用一些库, Python的python-docx, C#的pdfbox和npoi, 来让对Word和PDF的处理变得更加自动化一些。最后, 如果你想设计一些

03

一款漂亮的不像实力派的pdf软件分享

pdf 是一种便携式文档格式，它是 Adobe 公司在 1992 年开发的一种文档格式，它诞生的目的就是为了实现一种可以独立于应用程序，软件，还有操作系统的文档，也就说这个文档可以在任何操作系统上展现，并且展示的效果是统一的。

02

SpringBoot 下PDF生成使用填坑总结

解释： 1、Configuration cfg 使用了freemaker starter后，在项目启动时即会自动初始化 Configuration 对象到Spring容器中； 2、Template template = cfg.getTemplate("test.ftl","UTF-8"); 模板因cfg本身在Spring容器中，则在获取test.ftl模板是就会自动在resource/templates下寻找模板，默认：ftl 格式，可以修改 3、因为找了很多例子都是使用ITextRenderer 对象来渲染输出渲染的PDF，但ITextRenderer有一个问题是要解决中文不显示问题，必须把字体放在一个以文件夹路径访问的形式引入，SpringBoot打包后，经测试，无法获取打包后的FONT字体；则，再另辟途径，又找到以Document方式，但document需要的是，没一个dom对象都必须一个个添加进去，网上很多都是new 专门的对象，比如：块 Paragraph 然后添加文字(数字)内容。所以又搜索：是否可以往document插入html 最终找到：https://www.cnblogs.com/mvilplss/p/5646675.html

03

Word自动化(C# + Python)(持续更新中...)

目录前言读取Word内容 NPOI NPOI安装 NPOI提取Word内容用Costura.Fody打包DLL python-docx 读取PDF内容 python-docx自动生成Word 全局字体内容字体单元格合并最后 ----- 前言 Word就是那种很难用, 很丑陋, 但是你不得不用的东西, 在这一点上, 它甚至比Windows更甚(毕竟Gates是通过帮水果写Office才有机会接触Macintash和施乐的嘛, 你听过的, 两个小偷的故事). Windows可以用macOS + Pl

00

操作 PDF 文件的常用JAR包

iText 5是最早一个提供对PDF进行操作的JAR包，不过目前该JAR已经不再进行后续开发。可以从官网看到如下一段话：

02

java 利用 pdfbox 实现PDF转为图片

当时放到测试环境后一直显示乱码，看了下报错是说字体不存在。第一个想法是在主机上安装字体，但是又有问题了，生产不可能这样吧，运维也不同意啊。

01

Java 环境下用 PDFBox 实现 PDF 文档转换 JPG 图片的功能

PDFBox 是一个用于处理 PDF 文档的开源 Java 工具库。该项目允许创建新的 PDF 文档、操作现有文档以及从文档中提取内容。

03

LIMS系统仪器数据采集-使用xpdf解析pdf内容

不同语言解析PDF内容都有各自的库，比如Java的pdfbox，.net的itextsharp。 c#解析PDF文本，关键代码可参考： http://www.cnblogs.com/mahongbiao/p/7652788.html 此外也可使用OCR，关键代码可参考： http://www.cnblogs.com/mahongbiao/p/3760867.html 这些类库解析PDF文本有一个弊端，就是可配置性不强，它们多数是用于PDF文件生成的，对于PDF文本内容的提取仅提供一两个函数供调用。解析PD

04

AI文档智能助理都是如何处理pdf的？

在AI盛行的当下，基于文档的本地知识库智能问答系统已经成为当下最受AI从业者欢迎的落地方式。本文旨在收集整理当下AI应用中使用较多的处理pdf的库和开源项目，喜欢的请点赞、收藏。

02

Stirling-PDF一款开源可本地托管的pdf处理利器

这是一个健壮的、本地托管的基于Web的PDF操作工具，使用Docker实现。它使您能够对PDF文件执行各种操作，包括分割、合并、转换、重新组织、添加图像、旋转、压缩等。这个本地托管的Web应用程序已发展成为包含全面功能的套件，满足您所有的PDF需求。

01

java 往 pdf 插入数据 (pdfbox+poi)

pdfbox好像没有专门提供这个方法，但是现有的方法多重组合起来也能实现这个功能，

03

五分钟实现pdf分页

抱歉也开始用了这么“标题党”的标题。事情起源于前几天需要把个人资料的pdf文档一页一页的拆出来，好传到相关的网站上。直接截图到word再转pdf比较麻烦，所以想用工具直接转换。结果找了几个pdf阅读器，这类操作都需要会员或收费。作为一名程序员，这么简单的操作还要收费显然是一种羞耻（当然我是不会承认主要是因为qiong的），几分钟就可以代码解决的问题为啥要花钱呢？废话不多说，开搞。

02

PDF转Word完全指南：3大方法满足各种场景！

还不知道PDF怎么转Word吗，本文将提供完整的PDF转Word方案，包括离线、在线或者SDK API等各种方式，总有一款满足您的需求。

04

Java 解析pdf文档内容实战案例

上面这个文件是相对比较规整格式的文件，实际情况应该会有许多报表格式不一样，解析出来的有换行之类的，需要特殊处理。

03

java 打印pdf_java打印pdf文件

在我们的实际工作中，经常需要实现打印功能。但由于历史原因，Java 提供的打印功能一直都比较弱。实际上最初的 jdk 根本不支持打印，直到 jdk1.1 才引入了很轻量的打印支持。实际上，SUN 公司也一直致力于 Java 打印功能的完善，而 Java2 平台则终于有了一个健壮的打印模式的开端， jdk1.4 则提供了一套完整的”Java 打印服务 API” （Java Print Service API），它对已有的打印功能是积极的补充。

02

word转出图片（使用免费插件）01

word转pdf 方法1.poi读取doc + itext生成pdf （实现最方便，效果最差，跨平台）方法2.jodconverter + openOffice （一般格式实现效果还行，复杂格式容易有错位，跨平台）

02

java读取pdf文本转换html

完整的一个上传pdf转换为HTML功能（今后转换pdf也不需要找什么第三方了，哈哈）

04

5 个不错的开源项目！最后一个强烈推荐

项目介绍：基于 JavaFX 开发的文本编辑器，供了完善的文本编辑和查看功能，支持 Mac / Windows / Linux。

01

PDF文档的自动化测试

2.2、设计思路：场景一：最直接的方案是引入外部jar包，如PDFBox（ https://pdfbox.apache.org/index.html）。PDFBox是Apache下的一个开源项目，我们可以通过 PDFBox读取、创建PDF文档，加密/解密PDF文档，从PDF和XFDF格式中导入或导出表单数据等，实现代码如下：

02

获取pdf文档属性的方法

当我们想在打开pdf文件之前对pdf状态进行判断时，我们可以在pdf文档属性里添加自己需要的信息，例如把pdf的有效时间和开始时间以json格式保存在作者信息里，这样就方便得多了。因此我们需要这样的第三方的类库，对pdf文档信息进行读写，在这里我推荐pdfbox和pdfclown，这两个都是java处理pdf的类库，而且开源。下面主要介绍pdfclown，而pdfbox做法差不多。首先，我们在官网上下载pdfclown的源代码http://www.stefanochizzolini.it/

04

x-easypdf

分享一个PDF框架：https://gitee.com/dromara/x-easypdf

03

一些好用的开源控件

工作两年，一直都在做些编码方面的表面功夫，实现了很多很炫的功能，在此写下一些体验。有些比较小的dll文件我会发上来，如果是开源组织的代码我会把地址附上，毕竟人家是会更新的。大家还有什么好用的开源控件欢迎补充。一、CKeditor 富文本编辑器老版名称为fckeditor，相信大家耳熟能详。能够在页面上像word一样编辑文字效果。新版的CKeditor修改了很多bug，所有的功能都已插件形式实现。下面百度文库中的这篇文章介绍的比较好，如果有需要自定义代码的功能可以照下面地址做，我

06

PDF Explained（翻译）第一章简介

本文是对PDF Explained(by John Whitington)的摘要式翻译。

02

Java开发必须要知道的知识体系

Java是超高人气编程语言，拥有跨平台、面向对象、泛型编程等特性。在TIOBE编程语言排行榜中，连续夺得第一宝座，而且国内各大知名互联网公司，后端开发首选语言：非Java莫属。今天只是梳理下Java知识体系，后续会针对各类目有更详细的经验分享。

02

Word的这七种实用小技巧，你知道哪几个？

首先选择文件-选项-常规，然后在Office主题颜色中，选择一个即可。具体操作如下：

01

dotnet 修复 Uno 中文乱码

这是一个历史问题，在使用 Uno 展示中文的时候，如果设置 Uno 的底层使用 Skia 系进行渲染，那么将会因为中文字体问题，导致渲染出现乱码。此问题已被我修复，最佳解法是更新到最新版本

04

开源半个月收获接近 1k Star!你需要的开源项目都在这里！

半个月前，我开源了awesome-java ，这是一个 Github 上非常棒的 Java 开源项目集合。是的！就是下面这个这么骚的图标！

02

Java必知必会的常用类库

Java是一个开源的世界，如果你不懂的在网上寻找适合的轮子，而是经常避免造成，你将无法再代码的泥潭里解脱出来。但是这也不是一概而论的。初学者需要造轮子的能力，而熟练开发者需要改轮子的能力，精通者需要发现轮子的能力。今天整理一些在项目中常用的轮子，以便大家能在项目中使用。

01

【合合TextIn】智能文档处理系列—电子文档解析技术全格式解析

在当今的数字化时代，电子文档已成为信息存储和交流的基石。从简单的文本文件到复杂的演示文档，各种格式的电子文档承载着丰富的知识与信息，支撑着教育、科研、商业和日常生活的各个方面。随着信息量的爆炸性增长，如何高效、准确地处理和分析这些电子文档，已经成为信息技术领域面临的一大挑战。在这一背景下，电子文档解析技术应运而生，并迅速发展成为智能文档处理技术中的一个关键组成部分。

01

哥伦比亚大学研究人员创建隐藏嵌入文本信息新方法

哥伦比亚工程计算机科学家发明了一种新的方法 FontCode，可以在不干扰文字的情况下将隐藏信息嵌入文本中。FontCode 创建使用字体扰动来编码信息，之后可以进行解码以恢复信息。与其它隐藏嵌入信息的文本和文档的方法不同，这个方法适用于大多数字体和文档类型，即使打印文档或转换为其他文件类型时也可以保留隐藏信息。这项研究报告将于8月12日-16日在温哥华的 SIGGRAPH 上展示。

04

C#仪器数据文件解析-PDF文件

不少仪器工作站输出的数据报告文件为PDF格式，PDF格式用于排版打印，但不易于数据解析，因此解析PDF数据需要首先读取到PDF文件中的文本内容，然后根据内容规则解析有意义的数据信息。 C#解析PDF文件常用的库有PDFBox和iTextSharp，PDFBox为Java库，通过IKVM使用，因此调用方法、属性等比较变扭。 PDFBox解析PDF文本示例： PDDocument doc = PDDocument.load(input); str = new PDFTextStripper().getTex

06

设计师的春天：中文WebFont解决方案Font-Spider(字蛛) - 腾讯ISUX

我们在日常需求中，经常会碰到视觉设计师对某个中文字体效果非常坚持的情况，因为页面是否高大上，字体选择是很重要的一个因素，选择合适的字体可以让页面更优雅。面对这种问题，我们通常以下方式来进行设计还原：使用图片背景还原设计，即使用 photoshop 将文本图层单独导出成网页背景图片。产生的问题 1.制作与维护成本很高。切图繁琐、高清屏适配繁琐、合并雪碧图更繁琐，后期修改更加繁琐。 2.用户体验差。导致网页不支持选中、复制、搜索、翻译、矢量缩放，也会影响视障用户使用读屏器操作网页。 3.带来更多带宽消耗。导

04

IntelliJ IDEA 2019.3 发布，性能更牛逼！

距离 IntelliJ IDEA 2019.3 RC 发布不过几天的功夫，目前，IntelliJ IDEA 2019.3 也已正式发布。官方表示，该版本是其旗舰 IDE 的第三次也是最后一个主要版本。

02

java中使用tika_Tika基本使用

Tika是一个内容抽取的工具集合(a toolkit for text extracting)。它集成了POI, Pdfbox 并且为文本抽取工作提供了一个统一的界面。其次，Tika也提供了便利的扩展API，用来丰富其对第三方文件格式的支持。

01

PyMuPDF 1.24.4 中文文档（十三）

从版本 1.4 开始，PDF 支持将任意文件作为 PDF 文档文件的一部分（“嵌入式文件流”）嵌入其中（参见章节“7.11.4 嵌入式文件流”，第 103 页的 Adobe PDF 参考手册）。

01

Java开发必须要知道的知识体系

Java是超高人气编程语言，拥有跨平台、面向对象、泛型编程等特性。在TIOBE编程语言排行榜中，连续夺得第一宝座，而且国内各大知名互联网公司，后端开发首选语言：非Java莫属。今天只是梳理下Java知识体系，后续会针对各类目有更详细的经验分享。知识体系 JDK Java8 Lambda 语句方法引用日期／时间处理API 等等，不一一列举，详细的参考这些文档 URL:http://www.oracle.com/technetwork/cn/java/javase/documentation/index.

09

Java高效开发12个精品库

第一个要说的当然是JUnit了，JUnit毕竟是Java圈目前最知名及常用的测试框架。JUnit之所以能够成为Java圈中最热门的测试库，是因为对于很多项目而言，单元测试是非常重要的。优点有很多

04

Sketch60新版本来啦！新功能抢先看！

静电说：Sketch目前已经更新到60版本，其中包含了若干界面更新，另外Sketch团队现在一直在致力于云协作功能的研发，对于软件本身来说，如果你不使用云功能，那么这次更新并没有太多可说的。该卡的还是卡，仅仅是界面布局的调整。我真的很想问，什么时候Sketch的核心功能才能真正做好。不想说什么了，我想静静。下面就是这次更新的全部内容，翻译自官网。

01

5个职场必会的Word小技巧，越早知道越好

很多刚入职的小伙伴们每天在加班的时候，是不是还在心里埋怨领导布置的工作多呢？还要自己不停的加班才能完成，那为何自己不反思一下自己的方式错了吗？还是自己的某些方面能力不足呢？今天呢就来为大家分享几个Word工作中会遇到的小技巧，你越早知道越好哦。

04

基于编码注入的对抗性NLP攻击

研究表明，机器学习系统在理论和实践中都容易受到对抗样本的影响。到目前为止，此类攻击主要针对视觉模型，利用人与机器感知之间的差距。尽管基于文本的模型也受到对抗性样本的攻击，但此类攻击难以保持语义和不可区分性。在本文中探索了一大类对抗样本，这些样本可用于在黑盒设置中攻击基于文本的模型，而无需对输入进行任何人类可感知的视觉修改。使用人眼无法察觉的特定于编码的扰动来操纵从神经机器翻译管道到网络搜索引擎的各种自然语言处理 (NLP) 系统的输出。通过一次难以察觉的编码注入——不可见字符（invisible character）、同形文字（homoglyph）、重新排序（reordering）或删除（deletion）——攻击者可以显着降低易受攻击模型的性能，通过三次注入后，大多数模型可以在功能上被破坏。除了 Facebook 和 IBM 发布的开源模型之外，本文攻击还针对当前部署的商业系统，包括 Microsoft 和 Google的系统。这一系列新颖的攻击对许多语言处理系统构成了重大威胁：攻击者可以有针对性地影响系统，而无需对底层模型进行任何假设。结论是，基于文本的 NLP 系统需要仔细的输入清理，就像传统应用程序一样，鉴于此类系统现在正在快速大规模部署，因此需要架构师和操作者的关注。

01

批量比较两个PDF文档（PDFUtil通过文本/者图像进行比较）

在我的项目中，我需要比较大量的PDF文档，确认两份PDF文档是否一致，如果仅仅凭借着手动去逐一比较，可能很快就阵亡了。另外也有一些软件可以辅助的去对比，但依然是手动。

02

拆分保存在各个分散的单元格

因为XLM的构造特点，如Auto_Open、数量贼多的char函数等等，某些AV还不管三七二十一的给你误报，所以遴选公务员bypass还是比较困难的。现在这个钓鱼方法已经工具化了，往往都集成了各种编码，加密。这里只介绍几种从攻击团伙的样本中学到的一些姿势。

04

打造卓越排版，引领出版设计新潮流—Adobe InDesign 2019

Adobe InDesign是Adobe公司开发的一款设计和排版软件，被广泛应用于印刷和出版行业。InDesign 2019是该软件的最新版本，通过增加一系列新特性和改进现有功能，使得使用者可以更加轻松、更快速地完成设计任务。

01

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭