开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

合并PDF，同时保留自定义页码(也称为页签)和书签

合并PDF是指将多个PDF文件合并成一个单独的PDF文件。在合并过程中，保留自定义页码（页签）和书签是指合并后的PDF文件仍然能够保留原始PDF文件中的自定义页码和书签信息。

自定义页码（页签）是指用户可以为PDF文件中的每个页面设置一个自定义的标签或页码，用于快速定位和导航。书签是指在PDF文件中创建的可点击的导航链接，可以直接跳转到指定的页面或章节。

合并PDF并保留自定义页码和书签可以提高文件的整体可读性和导航性，方便用户快速定位和浏览所需内容。

在云计算领域，有许多工具和服务可以实现合并PDF并保留自定义页码和书签的功能。以下是一些推荐的腾讯云相关产品和产品介绍链接地址：

腾讯云对象存储（COS）：腾讯云对象存储是一种高可用、高可靠、低成本的云存储服务，可以用于存储和管理PDF文件。您可以使用COS提供的API或SDK来实现合并PDF的功能，并保留自定义页码和书签。了解更多：腾讯云对象存储产品介绍
腾讯云函数计算（SCF）：腾讯云函数计算是一种事件驱动的无服务器计算服务，可以实现按需运行代码的功能。您可以编写一个函数来处理合并PDF的逻辑，包括保留自定义页码和书签的操作。了解更多：腾讯云函数计算产品介绍
腾讯云API网关（API Gateway）：腾讯云API网关是一种托管的API服务，可以帮助您构建、发布、维护、监控和保护合并PDF的API接口。您可以使用API网关来定义一个合并PDF的API，并在后端实现自定义页码和书签的处理逻辑。了解更多：腾讯云API网关产品介绍

综上所述，合并PDF并保留自定义页码和书签是一项常见的需求，通过使用腾讯云的对象存储、函数计算和API网关等相关产品，可以实现这一功能，并提供高可用、高可靠、低成本的解决方案。

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

这才叫良心软件！！

同时使用者也需要留意源代码采用“良心授权”协议；如使用源代码开发了新的软件并获得收益，应将收益中不低于千分之一的金额捐赠给社会的弱势群体。...识别书签支持对 PDF 文档的标签进行编辑，支持自动根据你的文档生成对应的书签、导出/导入书签文档、更改页码、合并标签、设置标签格式等。...提取页面对 PDF 文档页面进行提取，可以选择需要保留的内容，包括有书签、属性、限制等。...合并后的PDF文档带有原文档的书签，还可挂上新书签（或根据文件名生成），新书签文本和样式可自定义。拆分合并拆分或合并PDF文件，并保留原文件的书签或挂上新的书签。...文字识别调用微软 Office 的图像识别引擎分析PDF文档图片中的文字；将图片PDF的目录页转换为PDF书签。识别结果可写入PDF文件。

1.4K2 0

PDFPatcher开源软件

它具有以下功能：修改PDF文档：修改文档属性、页码编号、页面链接；统一页面尺寸；删除自动打开网页等动作；去除复制及打印限制；设置阅读器初始模式；清理文档隐藏垃圾数据；重新压缩黑白图片；旋转页面。...贴心PDF书签编辑器：带有阅读界面（具有便于阅读竖排文档的从右到左阅读方式），可批量修改PDF书签属性（颜色、样式、目标页码、缩放比例等），书签可精确定位到页面中间；在书签中执行查找替换（支持正则表达式及...制作PDF文件：合并已有PDF文件或图片，生成新的PDF文件；合并后的PDF文档带有原文档的书签，还可挂上新书签（或根据文件名生成），新书签文本和样式可自定义；合并的PDF文档可指定统一的页面尺寸，以便打印和阅读...拆分或合并PDF文件，并保留原文件的书签或挂上新的书签。高速无损导出PDF文档的图片。将PDF页面转换为图片。...调用微软 Office 的图像识别引擎分析PDF文档图片中的文字；将图片PDF的目录页转换为PDF书签。识别结果可写入PDF文件。

2.8K1 0

Python利用PyPDF2库获取PDF文件总页码实例

补充知识：使用python合并pdf文件带书签 1、需求：将几本纸质书进行了扫描，可是扫描的每页生成一个pdf文件。需要怎么才能把这些pdf文件合成一个呢？...网上找了下python合并pdf的脚本，发现也没有添加书签的功能的，有添加书签的也不是很灵活。所有对网上找的一个python程序进行了升级，可以实现合并pdf并每个章节加入书签。..."/*.pdf") # 默认安装字典序排序，也可以安装自定义的方式排序 # file_list.sort() return file_list def get_dirs(filepath=''...将其合并输出到一个pdf文件中，输出的pdf文件默认带书签，书签名为之前的文件名 # 默认情况下原始文件的书签不会导入，使用import_bookmarks=True可以将原文件所带的书签也导入到输出的...pdf，然后再将这些pdf合并为一个大的pdf，这样做目的是想生成每个章节的书签 # 1.指定目录 # 原始pdf所在目录 path = "D:\spdf" # 输出pdf路径和文件名 output_filename

1.8K1 0

Office三件套批量转PDF以及PDF书签读写与加水印

书签的提取与写入 PDF书签提取 PDF书签保存到文件从文件读取PDF书签数据向PDF写入书签数据给PDF加水印生成水印PDF文件 PyPDF2库批量加水印拷贝书签加水印同时复制书签 PyMuPDF...] = i # 保存每个标题对应的标签数据，包括层级，标题和页码索引（页码-1） bookmark = [] def get_pdf_Bookmark_inter(outlines...书签数据有时我们希望自定义标签，所以可以从文件读取书签数据： def read_bookmark_from_file(filename="bookmark.txt"): bookmark =...") 最后保存看看： with open("tmp.pdf", "wb") as out: pdf_writer.write(out) 可以看到书签已经完美保留：给PDF加水印...idnum2pagenum[page.indirectRef.idnum] = i # 保存每个标题对应的标签数据，包括层级，标题和页码索引（页码-1） def get_pdf_Bookmark_inter

2.8K1 0

python pypdf2

split_pdf(infn, outfn) 3、追加：pdfWriter.appendPagesFromReader(reader) 书签：pdfWriter.addBookmark(title...，也可以是表示 PDF 文件路径的字符串。...(bool)：确定是否 warnings.py 用自定义实现覆盖 Python 模块（默认为 True） ---- PdfFileReader 对象的属性和方法属性和方法描述 getDestinationPageNumber...(destination) 检索给定目标对象的页码 getDocumentInfo() 检索 PDF 文件的文档信息字典 getFields(tree = None,retval = None...() 获取页面模式 getPageNumber(pageObject) 检索给定 pageObject 处于的页码 getXmpMetadata() 从 PDF 文档根目录中检索 XMP

5303 0

pdf拆分保留书签_pdf补丁

导出信息文件：将PDF文档中的元数据、阅读器初始状态、页码设置、页面设置、书签等信息导出成可编辑的XML文件。...补丁生成新文件：将上述信息文件和已有PDF文件合并，生成新的PDF文档，该PDF文档具有XML信息文件的设置（如页面设置、书签等）。...添加、修改或删除PDF文档的书签，设置书签的文字颜色、打开或收拢状态、点击后的跳转位置及页面缩放比例等。添加或修改页面内的链接。添加或更改PDF文档的逻辑页码编号。...版本更新说明 0.2.7.2 2010年6月11日新增功能：　　生成文件时可选自动生成文档书签。　　生成文件时可选保留源 PDF 文件的书签及页面链接。　　生成文件可选关闭书签。...合并图片后自动按顺序重命名文件。修复错误：　　修复了合并索引色图片后色彩错乱的问题。 0.2.7 新增功能：撰写了使用文档。合并导出信息和导入信息的功能为一个界面。

1.5K2 0

PDF Reader Pro for mac(全能pdf阅读器)

可让您直接在 Mac 上进行PDF文件阅读、笔记、编辑、转换、创建PDF、签署PDFs、填写PDF Forms表单、设置密码、合并拆分文件、水印等等，实现无纸化办公。...图片PDF Reader Pro for mac(全能pdf阅读器)软件特征轻松阅读 PDF阅读模式 – 支持多页签查看、全屏阅读、水平或垂直方向阅读，自动滚动模式演示 – 以PPT中的幻灯片模式来呈现...PDF文档夜间模式 – 在暗黑环境下阅读，舒缓双眼支持阅读大纲的创建、编辑和全文搜索功能，帮助轻松浏览整个文件在PDF指定页面和区域插入Bookmark书签PDF标记、注释使用专业PDF注释工具标记文档的重要信息...可连续添加批注工具签名 – 在任意位置利用触控板，键盘或图片创建手写签名或图片签名图章 – 添加标准预设图章，如机密，批准，未批准，或自定义文字图章或者图片图章链接 – 将文字与PDF页面或邮件Email...可更改PDF文字大小和颜色等属性创建、填写PDF表单创建和编辑表单。

1.3K2 0

JimuReport v1.6.2-GA3版本发布-修复高危SQL漏洞

项目介绍一款免费的数据可视化报表，含报表和大屏设计，像搭建积木一样在线设计报表！功能涵盖，数据报表、打印设计、图表报表、大屏设计等！...在设计报表使用数据图表设置为SQL数据集无法运行更新并保存#1629横向分组使用右侧输入值无法预览#1864在W列之后添加compute计算函数导致整个报表都无法显示#1866自定义函数参数中有单元格取值和自定义参数时...参数的宽度怎么调整#1631报表钻取问题,跳转参数设置问题,条件不生效问题#1604SQL解析空表时报500#1658api数据集，重新解析时最后一列参数配置的数据会被清除掉#1485关于数据集格式化后导出保留两位小数点...，在某些样式下无法导出pdf#1649关于数据解析的问题#1521日期时间类型数据，导出为pdf，格式不一致#1942自带的分页查询接口返回pageNo不对#1578api解析报表参数传时间默认值问题#1600API...自定义查询条件，API被调用多次#1325报表钻取后返回上一页发现日期查询条件的日期变成上一天了#1886升级版本后手写分页失效#1453页码显示有误#1893固定表头打印#1941版本1.6.0图表显示异常

3310 0

PowerBI 2018 8月更新一键导出PDF报告集合

报表方面：全报表一键导出PDF 书签分组主题正式发布分析方面：通过字段颜色值设置条件格式集成 Python 问答改进建模方面：度量值支持数据分类 DAX新增统计类函数 自定义可视化以及数据连接可进一步参考官方文档...PDF文件。...这里显示一个特殊的结果：可以看出缺点：导出方式比较机械，无法做细节设置不支持页码等（可手工在报表页面添加）不支持壁纸导出可以看出优点：可以导出除壁纸外的所有元素，包括自定义视觉元素完全按照报表尺寸导出...，也就支持大尺寸的报表页支持书签分组在实际的项目中，书签会大量出现，包括实现跳转、导航等，随着 PowerBI 实现复杂的报表项目，书签很重要，因此书签分组变得很有意义。...支持PY 会 Python 的伙伴可以尝试与 PowerBI 结合了，如下：这样，Power BI就可以和 R 以及 Python 并行工作了，当然用 Python 作图的效果无法实现交互式，有一定限制

3.4K4 0

苏生不惑又写了个小工具

之前分享过我写的一些工具整理下苏生不惑开发过的那些软件和脚本，不过导出的公众号pdf文件太多想合并成一个，于是用PDFShaper合并pdf，但合并后的pdf没有书签：于是用python写了个pdf...合并工具，这里以莫言的公众号文章为例，先下载他的所有公众号文章，详情见我之前的文章一键批量下载微信公众号文章内容/图片/封面/视频/音频，支持导出html和pdf格式，包含阅读数/点赞数/在看数/留言数...，导出的文章数据包含文章日期，文章标题，文章链接，文章简介，文章作者，文章封面图，是否原创，IP归属地，阅读数，在看数，点赞数和留言数等，看IP归属地莫言在上海：文章也同步到博客了 https:...() # to_word() 然后将转换的pdf合并成一个文件并生成书签。...",'wb') as f: file_writer.write(f) 合并后的效果：点击左侧书签跳转到对应文章pdf（含留言）：当然也可以导出pdf的书签到excel，包含书签名和页码

4552 0

Python 处理 PDF 的神器 -- PyMuPDF

它支持多种文档格式，如PDF、XPS、OpenXPS、CBZ、EPUB和FictionBook 2。您可以使用移动查看器对PDF文档进行注释和填写表单(这个功能很快也将应用于桌面查看器)。...功能对于所有支持的文档类型可以：解密文件访问元信息、链接和书签以栅格格式（PNG和其他格式）或矢量格式SVG呈现页面搜索文本提取文本和图像转换为其他格式：PDF, (X)HTML, XML..., JSON, text 对于PDF文档，存在大量的附加功能:它们可以创建、合并或拆分。...Document.select()将PDF压缩到选定页面，参数是要保留的页码序列。这些整数都必须在0<=i<page_ count范围内。执行时，此列表中缺少的所有页面都将被删除。...因此，您可以轻松地使用创建新的PDF： - 第一页或最后10页仅奇数页或偶数页（用于双面打印）包含或不包含给定文本的页颠倒页面顺序保存的新文档将包含仍然有效的链接、注释和书签（i.a.w.指向所选页面或某些外部资源

3.1K3 1

Python处理PDF——PyMuPDF的安装与使用

它支持多种文档格式，如PDF、XPS、OpenXPS、CBZ、EPUB和FictionBook 2。您可以使用移动查看器对PDF文档进行注释和填写表单(这个功能很快也将应用于桌面查看器)。...功能对于所有支持的文档类型可以：解密文件 - 访问元信息、链接和书签 - 以栅格格式（PNG和其他格式）或矢量格式SVG呈现页面 - 搜索文本 - 提取文本和图像 - 转换为其他格式：PDF..., (X)HTML, XML, JSON, text 对于PDF文档，存在大量的附加功能:它们可以创建、合并或拆分。...Document.select()将PDF压缩到选定页面，参数是要保留的页码序列。这些整数都必须在0<=i<page_ count范围内。执行时，此列表中缺少的所有页面都将被删除。...因此，您可以轻松地使用创建新的PDF： - 第一页或最后10页- 仅奇数页或偶数页（用于双面打印）- 包含或不包含给定文本的页- 颠倒页面顺序保存的新文档将包含仍然有效的链接、注释和书签（i.a.w

6.3K1 0

Python处理PDF——PyMuPDF的安装与使用

它支持多种文档格式，如PDF、XPS、OpenXPS、CBZ、EPUB和FictionBook 2。您可以使用移动查看器对PDF文档进行注释和填写表单(这个功能很快也将应用于桌面查看器)。...功能对于所有支持的文档类型可以：解密文件 - 访问元信息、链接和书签 - 以栅格格式（PNG和其他格式）或矢量格式SVG呈现页面 - 搜索文本 - 提取文本和图像 - 转换为其他格式：PDF..., (X)HTML, XML, JSON, text 对于PDF文档，存在大量的附加功能:它们可以创建、合并或拆分。...Document.select()将PDF压缩到选定页面，参数是要保留的页码序列。这些整数都必须在0<=i<page_ count范围内。执行时，此列表中缺少的所有页面都将被删除。...因此，您可以轻松地使用创建新的PDF： - 第一页或最后10页- 仅奇数页或偶数页（用于双面打印）- 包含或不包含给定文本的页- 颠倒页面顺序保存的新文档将包含仍然有效的链接、注释和书签（i.a.w

7.2K3 0

使用Python拆分和合并PDF文件

在本例中，使用的示例名为data-1.pdf（有兴趣的朋友可以到知识星球完美Excel社群中下载该文件，也可以自己制作一个用于演示的文件）。...图1：使用Python提取PDF文件基本信息为了演示，我将从文件中随机提取一些页面，假设我只想获得第1-3、5、6和11-12页。...因此，我们可以构造一个列表来存储页码：[1,2,3,4,5,11,12]。从PDF文件中获取页面我们可以使用pdf.getPage()从pdf对象获取特定页面。...Python的方法称为列表解析，或者有时在Python中称为“执行循环的一行程序”。...如果想合并多个PDF文件呢？过程和上文讲述的是一样的，所以不会在这里重复。提示： 1.循环遍历要合并的PDF文件。

2.5K1 0

ComPDFKit - 专业的PDF文档处理SDK

id=100085132077341 产品&功能： 1.ComPDFKit PDF SDK PDF查看提供强大的渲染引擎，轻松渲染复杂的PDF文档，支持自定义UI和各种功能操作，如单双页布局，连续滚动...，书签，大纲和缩略图等。...PDF页面管理添加PDF页面管理功能到应用程序，实现PDF文档增加空白页、删除、复制、重排、旋转、裁剪、拆分合并等页面管理的所有需求。...针对共享文件，可添加自定义的页眉页脚、水印、贝茨码来保护知识产权。 标记密文对图像、文本和矢量图形中的敏感信息或隐私数据进行不可逆的密文处理，阻止了他人访问敏感信息。同时支持多种方式标记密文。...PDF查看提供强大的渲染引擎，轻松渲染复杂的PDF文档，支持自定义UI和各种功能操作，如单双页布局，连续滚动，书签，大纲和缩略图等。

7.3K6 0

用Python处理PDF

可用的pdf库用pdf2合并和切分PDF 比较几个库之后打算先从PyPDF2快速实现一些功能。...，意思也很明确。...切分测试结果截图通过上面的实践，可以看到实现这几个需求高频使用到的方法就是新建一个Reader或Writer对象，通过.getNumPages()获取一共的页码，通过.getPage(page)获取特定页...，.addPage()写入页码。...图片转pdf对比效果页面处理过滤pdf中的的特定页面，只保留特定页面；另一方面，给pdf文件添加特定页面； #过滤pdf的特定页面，只保留特定页面； from PyPDF2 import PdfFileReader

1.7K6 0

Python 深入浅出 – PyPDF2 处理 PDF 文件

实际应用中，可能会涉及处理 pdf 文件，PyPDF2 就是这样一个库，使用它可以轻松的处理 pdf 文件，它提供了读，割，合并，文件转换等多种操作。...参数： stream：*File 对象或支持与 File 对象类似的标准读取和查找方法的对象，也可以是表示 PDF 文件路径的字符串。...(bool)：确定是否 warnings.py 用自定义实现覆盖 Python 模块（默认为 True） PdfFileReader 对象的属性和方法属性和方法描述 getDestinationPageNumber...getPageNumber(pageObject) 检索给定 pageObject 处于的页码 getXmpMetadata() 从 PDF 文档根目录中检索 XMP 数据 isEncrypted 显示...,保存至文件中 pdfFileWriter.write(open(outFile,'wb')) 结果是：在写入的 copy.pdf 文档的最后最后一页写入了一个空白页。

1.6K3 0

PyPDF2模块

，也可以是表示 PDF 文件路径的字符串。...(bool)：确定是否 warnings.py 用自定义实现覆盖 Python 模块（默认为 True） PdfFileReader 对象的属性和方法属性和方法...描述 getDestinationPageNumber(destination) 检索给定目标对象的页码 getDocumentInfo() 检索 PDF 文件的文档信息字典...'> # 获取 pageObject 在 PDF 文档中处于的页码 PageNumber=pdfFileReader.getPageNumber(pageobj) print("...indirectRef：将源对象的原始间接引用存储在其源 PDF 中 PageObject 对象的属性和方法属性或方法描述 static createBlankPage(pdf=None,width

6781 0

极力推荐的谷歌浏览器插件

Tampermonkey Tampermonkey用于运行所谓的用户脚本（有时也称为Greasemonkey脚本）。...Smallpdf 轻松易用的PDF工具，可用于编辑、转换、合并、拆分和压缩PDF文件。可与Gmail整合。...① PDF转换为Word，Excel，PPT ② Word，Excel，PPT转到PDF ③ 编辑PDF Top 12. Enable Copy 遇到限制复制粘贴和右键的网页是不是很头痛？...FireShot 网页截图插件，可以实现网页滚动截图功能，这是大部分Snipaste等桌面截图软件都不具备的功能，截图之后，我们可以直接导出图片，也可以保存为PDF。 Top 20....书签侧边栏 Chrome书签管理功能增强，这款插件可以将书签放置在浏览器的左边或者右边，鼠标轻轻点击，书签就会出现。

2.8K2 1

python读取pdf提取文字和图片

问题描述如下图所示，一份pdf有几十页，每页九张图片，提取出图片并用图片下方的文本对图片命名主要涉及问题：图片提取文本识别借鉴了上面文本识别的资料，上面图片提取的顺序不一致，没办法把两个结合起来实现我的需求...，因为格式比较固定所以可以用这种方式，更好的方法暂时没找到，网上没找到相关问题的比较完整的处理方法，我这应该是首发，欢迎有其他更好的方法的朋友，评论区探讨一下关于Image图片处理之前也写过几篇博客：...pic_path = os.path.join(page_path,pic_name) im=Image.open(pic_path) # pdf中的页码...= f"存档//{today}//pic" # 单页图片存储地址 page_path = "page_pic" # 自定义解码字典 - 及时更新补充识别文本时对应无法识别的编码 # 防爬虫识别码...,page_path) # 把提取到的文字整理后保存到本地-合并成一列，并只保留图片信息 pic_name.to_excel(os.path.join(fina_path,"pdf文字信息.xlsx

7.4K3 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭