首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

python pdf (PyPDF2模块)-如何拆分/合并?

PyPDF2是一个用于处理PDF文件的Python库。它提供了拆分和合并PDF文件的功能。

拆分PDF文件: 要拆分PDF文件,可以使用PyPDF2库中的PdfFileReader和PdfFileWriter类。首先,使用PdfFileReader类打开要拆分的PDF文件,并获取其页面数量。然后,创建一个新的PdfFileWriter对象,并使用addPage()方法将要拆分的页面添加到该对象中。最后,使用write()方法将新的PdfFileWriter对象保存为一个新的PDF文件。

以下是一个示例代码,演示如何拆分PDF文件:

代码语言:txt
复制
from PyPDF2 import PdfFileReader, PdfFileWriter

def split_pdf(input_path, output_path, start_page, end_page):
    pdf = PdfFileReader(input_path)
    writer = PdfFileWriter()

    for page_num in range(start_page - 1, end_page):
        writer.addPage(pdf.getPage(page_num))

    with open(output_path, 'wb') as output_file:
        writer.write(output_file)

# 使用示例
split_pdf('input.pdf', 'output.pdf', 1, 3)

合并PDF文件: 要合并PDF文件,同样可以使用PyPDF2库中的PdfFileReader和PdfFileWriter类。首先,创建一个新的PdfFileWriter对象。然后,使用PdfFileReader类打开要合并的PDF文件,并将其所有页面添加到新的PdfFileWriter对象中。最后,使用write()方法将新的PdfFileWriter对象保存为一个新的PDF文件。

以下是一个示例代码,演示如何合并PDF文件:

代码语言:txt
复制
from PyPDF2 import PdfFileReader, PdfFileWriter

def merge_pdf(input_paths, output_path):
    writer = PdfFileWriter()

    for path in input_paths:
        pdf = PdfFileReader(path)
        for page_num in range(pdf.getNumPages()):
            writer.addPage(pdf.getPage(page_num))

    with open(output_path, 'wb') as output_file:
        writer.write(output_file)

# 使用示例
merge_pdf(['input1.pdf', 'input2.pdf'], 'output.pdf')

这些示例代码演示了如何使用PyPDF2库拆分和合并PDF文件。你可以根据自己的需求进行修改和扩展。如果你想了解更多关于PyPDF2库的信息,可以访问腾讯云的PyPDF2产品介绍页面:PyPDF2产品介绍

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

使用Python拆分合并PDF文件

因此,我需要一种分割PDF文件的方法。虽然Adobe Acrobat Pro DC允许拆分合并PDF文件,但需要付费。 Python就能够实现,谁不喜欢免费的解决方案呢?...getPage()方法允许我们将PDF文件拆分为单独的页面,以便我们可以选择,然后使用Python将它们合并到一个文件中。...将上述代码放到一起 下面是允许你使用Python拆分合并PDF文件的完整代码: from PyPDF4 import PdfFileReader,PdfFileWriter pdf =PdfFileReader...','wb') as f: pdf_writer.write(f) 小结 我们已经介绍了如何使用Python处理PDF文件: 1.获取有关PDF文件的基本信息。...2.通过提取单个页面来拆分PDF文件。 3.将页面合并到新的PDF文件中。 注:本文学习整理自pythoninoffice.com。 欢迎在下面留言,完善本文内容,让更多的人学到更完美的知识。

2.5K10

Python也可以合并拆分PDF,批量高效!

PDF是最方便的文档格式,可以在任何设备原样且无损的打开,但因为PDF不可编辑,所以很难去拆分合并。 知乎上也有人问,如何PDF进行合并拆分?...而且很多软件是收费的,本来PDF合并拆分也不是什么难事,赚的是信息差的钱。 我一般会用PythonPyPDF2库来编辑PDF,其中就包括合并拆分多个PDF。...使用Python来实现的好处是处理PDF速度快,可大批量操作,而且免费。...话不多说,下面给出案例代码: 该示例代码定义了两个函数 merge_pdf() 和 split_pdf(),分别用于合并拆分 PDF。...在测试代码中,首先调用 merge_pdf() 函数将两个 PDF 文件合并,然后调用 split_pdf() 函数将合并后的 PDF 文件拆分为多个页面,并将这些页面保存到不同的文件中。

14210

VB.NET 拆分合并PDF工具(PDF批量打印)

VB.NET 合并PDF工具(PDF批量打印) 有粉丝后台留言想要拆分PDF文档的工具,那么他来了..... 上两期原文 问:为什么要自己做,不使用网上的现成工具?...答:因现在网上99%以上的PDF合并工具都是需要收费,或者要使用收费的破J版,或者是一些网页的在线服务不能上传和合并大批量的文件(这也涉及到文件的安全性)所以想着自己弄一个....答:开发这款小工具主要解决的问题是大批量打印PDF文件,平常在工作中我们常常需要打印大批量的PDF文件,我们通常的操作就是使用PDF阅读器,一个个打开然后,然后就是一个个点击打印(这是我知道的方式哈,有更简洁的方式请广大的网友分享一下...一次性合并成一个文件,然后发送到打印机,这样就不怕中断,因它只是一个单一文件,同时打印别人也无法插进来,要等当前单个文件打印完成后别人才能插进来,文件也不会出现错乱,不用可以去分类,这就是开发这个小工具的意义所在...本期只做上期VB.NET 合并PDF工具(PDF批量打印)的补充,这次新增了批量拆分PDF文档操作,下面看演示 核心代码 Sub Split_all_pdf(datapath As String

1.5K20

Python玩转PDF的各种骚操作

本文将带你了解如何执行以下操作: 从Python中提取PDF中的文档信息  旋转页面  合并PDF  拆分PDF  添加水印  加密PDF pyPdf,PyPDF2和PyPDF4的历史 最初的pyPdf...如何Python中提取PDF文档信息 我们可以使用PyPDF2PDF中提取元数据和一些文本,尤其是当在预先存在的PDF文件上执行某些类型的自动化时是非常有用的。...挑战一点的话,也可以使用Python的argparse模块为这个函数创建一个命令行接口。 如何拆分PDF? 有时可能需要将PDF拆分为多个PDF,对于包含大量扫描内容的PDF来说尤其重要。...以下是如何使用PyPDF2PDF拆分为多个文件: fromPyPDF2importPdfFileReader,PdfFileWriter defsplit(path,name_of_split): pdf...结论 PyPDF2包非常有用,可以使用PyPDF2自动执行脚本完成PDF文档的批量操作。本文介绍了如何PDF中提取元数据,旋转页面,合并拆分PDF,添加水印,以及添加加密的操作。

2.1K50

如何使用Python玩转PDF各种骚操作?

本文将带你了解如何执行以下操作: 从Python中提取PDF中的文档信息 旋转页面 合并PDF 拆分PDF 添加水印 加密PDF pyPdf,PyPDF2和PyPDF4的历史 最初的pyPdf...如何Python中提取PDF文档信息 我们可以使用PyPDF2PDF中提取元数据和一些文本,尤其是当在预先存在的PDF文件上执行某些类型的自动化时是非常有用的。...挑战一点的话,也可以使用Python的argparse模块为这个函数创建一个命令行接口。 如何拆分PDF? 有时可能需要将PDF拆分为多个PDF,对于包含大量扫描内容的PDF来说尤其重要。...以下是如何使用PyPDF2PDF拆分为多个文件: from PyPDF2 import PdfFileReader, PdfFileWriter def split(path, name_of_split...结论 PyPDF2包非常有用,可以使用PyPDF2自动执行脚本完成PDF文档的批量操作。本文介绍了如何PDF中提取元数据,旋转页面,合并拆分PDF,添加水印,以及添加加密的操作。

1.9K20

如何使用Python玩转PDF各种骚操作?

本文将带你了解如何执行以下操作: 从Python中提取PDF中的文档信息 旋转页面 合并PDF 拆分PDF 添加水印 加密PDF pyPdf,PyPDF2和PyPDF4的历史 最初的pyPdf...如何Python中提取PDF文档信息 我们可以使用PyPDF2PDF中提取元数据和一些文本,尤其是当在预先存在的PDF文件上执行某些类型的自动化时是非常有用的。...挑战一点的话,也可以使用Python的argparse模块为这个函数创建一个命令行接口。 如何拆分PDF? 有时可能需要将PDF拆分为多个PDF,对于包含大量扫描内容的PDF来说尤其重要。...以下是如何使用PyPDF2PDF拆分为多个文件: from PyPDF2 import PdfFileReader, PdfFileWriter def split(path, name_of_split...结论 PyPDF2包非常有用,可以使用PyPDF2自动执行脚本完成PDF文档的批量操作。本文介绍了如何PDF中提取元数据,旋转页面,合并拆分PDF,添加水印,以及添加加密的操作。

1.2K20

如何使用Python玩转PDF各种骚操作?

本文将带你了解如何执行以下操作: 从Python中提取PDF中的文档信息 旋转页面 合并PDF 拆分PDF 添加水印 加密PDF pyPdf,PyPDF2和PyPDF4的历史 最初的pyPdf...如何Python中提取PDF文档信息 我们可以使用PyPDF2PDF中提取元数据和一些文本,尤其是当在预先存在的PDF文件上执行某些类型的自动化时是非常有用的。...挑战一点的话,也可以使用Python的argparse模块为这个函数创建一个命令行接口。 如何拆分PDF? 有时可能需要将PDF拆分为多个PDF,对于包含大量扫描内容的PDF来说尤其重要。...以下是如何使用PyPDF2PDF拆分为多个文件: from PyPDF2 import PdfFileReader, PdfFileWriter def split(path, name_of_split...结论 PyPDF2包非常有用,可以使用PyPDF2自动执行脚本完成PDF文档的批量操作。本文介绍了如何PDF中提取元数据,旋转页面,合并拆分PDF,添加水印,以及添加加密的操作。

1.1K30

Python玩转PDF各种骚操作大全!

本文将带你了解如何执行以下操作: 从Python中提取PDF中的文档信息 旋转页面 合并PDF 拆分PDF 添加水印 加密PDF pyPdf,PyPDF2和PyPDF4的历史 最初的pyPdf软件包于2005...如何Python****中提取PDF文档信息 我们可以使用PyPDF2PDF中提取元数据和一些文本,尤其是当在预先存在的PDF文件上执行某些类型的自动化时是非常有用的。...挑战一点的话,也可以使用Python的argparse模块为这个函数创建一个命令行接口。 如何拆分PDF? 有时可能需要将PDF拆分为多个PDF,对于包含大量扫描内容的PDF来说尤其重要。...以下是如何使用PyPDF2PDF拆分为多个文件: from PyPDF2 import PdfFileReader, PdfFileWriter def split(path, name_of_split...结论 PyPDF2包非常有用,可以使用PyPDF2自动执行脚本完成PDF文档的批量操作。本文介绍了如何PDF中提取元数据,旋转页面,合并拆分PDF,添加水印,以及添加加密的操作。

1.5K40

PyPDF2 | 利用 Python 实现 PDF 分割

图1 分割前的 PDF 在百度了一番后,发现大多都是使用 Adobe Acrobat 软件进行剪裁,这完全不 Pythonic,因此又找了用 Python 处理 PDF 文件的方法,最后发现了 PyPDF2...首先,你需要通过 pip 安装这个库: pip install PyPDF2 实现切割 PDF 的思想很简单,只要我们能测量出 PDF 的长宽,接着分别将左右裁剪拼接即可,而 PyPDF2 已经提供了这些功能...: # PdfFileReader 模块用于读取 pdf # PdfFileWriter 模块用于创建要保存的 pdf from PyPDF2 import PdfFileReader, PdfFileWriter...循环所有的页数后,将文件输出为 pdf 文件 pdf_output.write(open('xxx,pdf', 'wb')) 需要注意的是,PyPDF2 默认将较短的边作为 X 轴,较长的边作为 Y 轴...,对应的坐标如下: 图2 纵向比例下的 PyPDF2 坐标 然而我们的 PDF 是横向比例的,如下图所示: 图3 横向比例 PDF 示例 相当于: 图4 横向比例下的 PyPDF2

2K20

还在傻傻付费合并 PDF 文件?

但你会发现,很多时候,我们需要将几份 PDF 合并为一个 PDF 文件,这个时候你往往会去百度,然后打开一个付费的 PDF 合并网站开始合并。 还在傻傻付费合并 PDF 文件?...今天,我给你分享一个一键合并 PDF 的办公自动化方案!还是用我们熟悉的 Python 语言,不过这回我们会调用 PyPDF2 这个模块。...具体如何使用这个模块,我这里就不详细说了,具体看 http://pythonhosted.org/PyPDF2/ 这个官方说明。...让 Python 开干 导入 PyPDF2 模块: from PyPDF2 import PdfFileReader, PdfFileWriter 这两个方法对应了 pdf 文件的读取和写入,其中 PdfFileReader...with 这句话,新建了 3.pdf,并由写入器的pdf_writer.write(out) 方法输出。 结语 下一期,我给你科普一下如何Python 帮我们拆分 PDF

69720

使用PyPDF2模块处理PDF文件通用方法技巧

处理PDF文件,使用PyPDF2模块PyPDF2不能从PDF文档中提取图像、图表或其他媒体,但可提取文本,作为字符串返回。...读取PDF文件步骤: 首先以读二进制模式打开PDF文件,然后将打开文件File对象传递给PyPDF2.PdfFileReader()函数,例如: pdf=open(r’C:/Users/fmz/...创建PDF:使用PdfFileWriter对象创建PDF例如pdfwriter=PyPDF2.PdfFileWriter(),但PyPDF2模块不可以利用其将任何文 本写入PDF,该对象仅限从其他...PyPDF2模块不允许直接编辑PDF,必须 创建一个新的PDF,其一般步骤为: 1) 打开一个或多个已有的PDF得到PdfFileReader对象; 2) 创建一个新的PdfFileReader...叠加页面:PyPDF2模块可将一页的内容叠加到另一页上实现在页面上添加公司标志,时间戳或水印等。

1.2K30

Python自动化(二十) | 聊聊 Python 操作PDF的几种方法(合并拆分、水印、加密)

一、前言 大家好,有关Python操作PDF的案例之前已经写过一个?...PDF批量合并,这个案例初衷只是给大家提供一个便利的脚本,并没有太多讲解原理,其中涉及的就是PDF处理很实用的模块PyPDF2,本文就好好剖析一下这个模块,主要将涉及 os 模块综合应用 glob 模块综合应用...PyPDF2 模块操作 二、基本操作 PyPDF2 导入模块的代码常常是: from PyPDF2 import PdfFileReader, PdfFileWriter 这里导入了两个方法: PdfFileReader...最后,用with新建一个pdf并由写入器的 pdf_writer.write(out)方法输出即可 四、拆分 如果明白了合并操作中读取器和写入器的配合,那么拆分就很好理解了,这里我们以拆分INV1.pdf...(密码) 以单个PDF的加密为例: 写在最后 当然除了对PDF合并拆分、加密、水印,我们还可以使用Python结合Excel和Word实现更多的自动化需求,这些就留给读者自己开发。

88121

聊聊 Python 操作PDF的几种方法(合并拆分、水印、加密)

一、前言 大家好,有关Python操作PDF的案例之前已经写过一个?...PDF批量合并,这个案例初衷只是给大家提供一个便利的脚本,并没有太多讲解原理,其中涉及的就是PDF处理很实用的模块PyPDF2,本文就好好剖析一下这个模块,主要将涉及 os 模块综合应用 glob 模块综合应用...PyPDF2 模块操作 二、基本操作 PyPDF2 导入模块的代码常常是: from PyPDF2 import PdfFileReader, PdfFileWriter 这里导入了两个方法: PdfFileReader...最后,用with新建一个pdf并由写入器的 pdf_writer.write(out)方法输出即可 四、拆分 如果明白了合并操作中读取器和写入器的配合,那么拆分就很好理解了,这里我们以拆分INV1.pdf...(密码) 以单个PDF的加密为例: 写在最后 当然除了对PDF合并拆分、加密、水印,我们还可以使用Python结合Excel和Word实现更多的自动化需求,这些就留给读者自己开发。

1K20

教你用Python 操作 PDF 的几种方法

作者 | 陈熹 来源 | 早起Python(ID:zaoqi-python) 01 前言 大家好,有关 Python 操作 PDF 的案例之前已经写过一个?...PDF批量合并,这个案例初衷只是给大家提供一个便利的脚本,并没有太多讲解原理,其中涉及的就是 PDF 处理很实用的模块 PyPDF2 ,本文就好好剖析一下这个模块,主要将涉及 os 模块综合应用 glob...模块综合应用 PyPDF2 模块操作 02 基本操作 PyPDF2 导入模块的代码常常是: from PyPDF2 import PdfFileReader, PdfFileWriter 这里导入了两个方法...04 拆分 如果明白了合并操作中读取器和写入器的配合,那么拆分就很好理解了,这里我们以拆分 INV1.pdf 为2个单独的 pdf 文档为例,同样也先来捋一捋逻辑: 读取器读取 PDF 文档 读取器一页一页交给写入器...(密码) 以单个 PDF 的加密为例: 写在最后 当然除了对 PDF合并拆分、加密、水印,我们还可以使用 Python 结合 Excel 和 Word 实现更多的自动化需求,这些就留给读者自己开发

1.1K10
领券