首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

用python将多页pdf文件拆分成多个pdf文件?

您好!您的问题是关于如何使用Python将多页PDF文件拆分成多个PDF文件。

在这种情况下,您可以使用一个名为PyPDF2的Python库。PyPDF2是一个用于处理PDF文件的库,可以用来合并、拆分和提取PDF文件的信息。

以下是使用PyPDF2将多页PDF文件拆分成多个PDF文件的示例代码:

代码语言:python
复制
import PyPDF2

# 打开PDF文件
with open('input.pdf', 'rb') as file:
    pdf_reader = PyPDF2.PdfFileReader(file)

    # 获取PDF文件的页数
    num_pages = pdf_reader.numPages

    # 循环遍历每一页
    for page_num in range(num_pages):
        # 创建一个新的PDF文件
        pdf_writer = PyPDF2.PdfFileWriter()

        # 添加当前页到新的PDF文件
        pdf_writer.addPage(pdf_reader.getPage(page_num))

        # 将新的PDF文件保存到文件中
        with open(f'output{page_num}.pdf', 'wb') as output:
            pdf_writer.write(output)

这段代码将会将输入的多页PDF文件拆分成多个单页PDF文件,并将它们保存到当前目录中。

希望这个答案能够帮助您解决问题!

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

使用python合并多个pdf文件

今天需要整理一份资料,需要把多个pdf合并为一个,wps这些软件自然是有这个功能,但一般都是收费的,百度上也有很多网站,但资料上传到别人的网站,始终觉得还是不太可靠,故自己搜索了一下使用python来处理...pdf文件,故此分享这个方法 python处理pdf需要用到一个PyPDF2的库,故首先安装这个第三方库 安装这些第三方库推荐使用国内的源,比如清华、豆瓣、百度、华为等 pip install PyPDF2...target_path = r'pdf' ## pdf目录文件 pdf_lst = [f for f in os.listdir(target_path) if f.endswith('.pdf'...() for pdf in pdf_lst: file_merger.append(pdf,import_bookmarks=False) # 合并pdf文件 file_merger.write...(r"合并文件.pdf") 注意一下: 合并的时候,pdf_lst 是根据文件的名称来排序生成,如果对于pdf文件合成顺序有要求,建议吧文件按照期望的合成顺序编号1 2 3这样,方便一些 比如像下面这种

2K10

使用Python合并任意多个PDF文件

在工作中,经常会遇到合并pdf文件的需求,这时候你会发现不是一件很容易完成的任务。包括WPS、福昕阅读器在内的很多软件都有合并pdf文件的功能,但是只有交钱变成会员之后才能使用,否则只能合并3。...有不少网站提供了在线合并pdf文件的功能,但也是必须交钱才能用。还有的显示合并成功,但就是无法下载。如果你会一点Python,就会发现这是一件很容易的事,并且不用花一分钱。...功能描述: 使用Python合并任意多个PDF文件。 详细步骤: 1、安装扩展库PyPDF2。 ? 2、编写代码。 ?...3、把代码中pdf_files的内容改成自己要合并pdf文件名,运行代码,一眨眼,合并完成。

4.3K20

使用Python一个Excel文件分成多个Excel文件

标签:Python,pandas库,openpyxl库 本文展示如何使用PythonExcel文件拆分为多个文件。拆分Excel文件是一项常见的任务,手工操作非常简单。...示例文件直接读入pandas数据框架: 图1 该数据集一些家电或电子产品的销售信息:产品名称、产地、销售量。我们的任务是根据“产品名称”列数据拆分为不同的文件。...基本机制很简单: 1.首先,数据读入Python/pandas。 2.其次,应用筛选器数据分组到不同类别。 3.最后,数据组保存到不同的Excel文件中。...最后,可以每个数据集保存到同一Excel文件中的单独工作表中。...图4 图5 使用Python拆分Excel工作簿为多个Excel工作簿 如果需要将数据拆分为不同的Excel文件(而不是工作表),可以稍微修改上面的代码,只需将每个类别的数据输出到自己的文件中。

3.4K30

Excel实战技巧43: 多个PDF文件中指定页面合并成一个PDF文件

学习Excel技术,关注微信公众号: excelperfect 在《Python实战01:合并多个PDF文件》和《Python实战02:分别合并多个相似文件名的PDF文件》中,我们使用Python代码对...图3 在上图3所示的工作表中,在每个PDF文件名相邻的单元格,输入要合并的PDF文件页码,如果要合并,则用逗号分隔开。...例如,数字2表明要合并文件“完美Excel.pdf”的第2,数字2,6表明要合并文件“汇总.pdf”的第3和第6,如下图4所示。 ?...图4 下面的代码取出要合并的PDF文件中的页面并保存为一个单独的PDF文件: Sub SplitPDFFilesIntoSinglePages() '引用 :Adobe Acrobat 10.0 Type...文件所在的文件夹,因为我们拆出的单独的PDF文件放置在了“合并的文件文件夹中,应此选该文件夹,如下图6所示。

5.7K72

Python玩转PDF | 批量拆分文件

如果一个PDF文件页数较多,导致体积较大,可以将其拆分成几个部分,以方便阅读。那么如何拆分?今天继续分享使用Python编写程序来完成PDF文件的批量拆分。 这里采用按固定页数进行拆分的方式。...例如,假设按每份5进行拆分,那么一个27PDF文件会被拆分成6份(27/5=5.4≈6),第1~5份均为5,第6份为2。仍然使用PyPDF2模块来拆分PDF文件。...src, size): in_dir = Path(src) all_pdf_file = list(in_dir.glob('*.pdf')) for pdf in all_pdf_file...拆分函数,需要两个参数,一个为PDF文件目录src,一个为拆分页数size,也就是多少文件拆分为一个文件。...程序运行后,会把文件目录下所有满足条件的PDF文件,进行拆分,也可以理解为文件批量拆分。

64120

软件测试|教你Python处理PDF文件(三)

前言 我们之前介绍了提取PDF文件中的文字内容,我们使用PyPDF2即可实现操作,但是如果PDF文件有图片的话,只提取文本的话无法把图片的内容一起提取出来,我们需要另外的脚本来实现对图片的提取。...使用实例 我们提取PDF文件中的图片的代码如下: import PyPDF2 from PIL import Image def extract_images_from_pdf(pdf_path,...() # 使用示例 pdf_path = 'files/test2.pdf' # PDF文件路径 output_folder = 'files' # 图片输出的文件夹路径 extract_images_from_pdf...(pdf_path, output_folder) 运行脚本,发现files文件夹新增了两个jpg文件,如下: 图片 图片如下: 图片 总结 本文主要介绍了使用PyPDF2库实现对PDF文件中的图片进行提取的操作...,后续我们介绍提取PDF文件中的表格内容。

17640

软件测试|教你Python处理PDF文件(四)

前言 之前我们介绍了从PDF文件中提取文本内容以及从PDF文件提取图片的方法,除了文本内容与图片,表格也PDF文件中常见的内容,提取表格内容时,我们不再使用PyPDF2库来实现操作,Python多个库来实现提取表格内容...,本文我们分别介绍多个库提取PDF中表格的操作。...,可以通过这个特点将一段的文本整合 表格数据抽取:不会被换行数据所干扰 但是,它也不是完美的,缺点如下: 进行文本抽取时,如果一有文本和表格,那么抽取的文本数据也会包括表格数据 对于有合并单元格的表格..., pages='all') return tables # 使用示例 pdf_path = 'files/test.pdf' # 替换为实际的PDF文件路径 extracted_tables...总结 本文主要介绍了Python提取PDF表格内容的方法,如果我们只提取表格内容的话,使用tabula-py会更为理想一些。

27720

软件测试|教你Python处理PDF文件(一)

但是PDF文件的内容复制并不方便,要是能够使用Python内容取出来的话,就会很舒服了!本文就来给大家介绍一下Python处理PDF文件的方法。...环境与资源准备 Python有一个非常优秀的处理PDF的第三方库——PyPDF2,这是一个开源免费的库,用于处理PDF文件,能够实现对PDF文件的分离、合并、裁剪、转换、加密、解密等操作。...安装如下: pip install PyPDF2 资源准备 我们创建了一个PDF文件文件名为test.pdf文件第一内容为拜仁慕尼黑,第二主要内容为两张图片,第三主要内容为一个表格。...' # 待拼接的pdf文件以绝对路径的形式放在一个列表里 pdf_list = [f for f in os.listdir(src_path) if f.endswith('.pdf')] pdf_list...Python读取PDF文件以及合并多个PDF文件,为PDF文件添加水印功能的实现,后续我们将为大家介绍为PDF加密与解密的操作。

24120

软件测试|教你Python处理PDF文件(二)

前言 上一篇文章我们介绍了Python使用pypdf2实现读取PDF文件的文本内容,合并PDF文件,以及为PDF文件添加水印,本篇文章我们来介绍使用Python实现对PDF文件的加密解密。...PDF文件加密,python支持给PDF文件加密,代码如下: from PyPDF2 import PdfReader, PdfWriter reader = PdfReader("files/test.pdf...") writer = PdfWriter() # 拷贝每一的内容 for page in reader.pages: writer.add_page(page) # 在新的pdf文件中添加密码...= PdfWriter() # 解密 if reader.is_encrypted: reader.decrypt("secret-password") # 每一内容加到writer对象中...") as f: writer.write(f) 运行脚本后,我们可以新增了一个test_decrypted.pdf,可以直接点击查看文件内容,如下: 图片 总结 本文主要为大家介绍了使用Python

16920

Python快速将任意文件转为PDF

今天辰哥就教大家任意文件批量转为PDF,这里以日常办公的word、excel、ppt为例,这三种格式的文件转为PDF。...01 word转PDF 这里借助Python的docx2pdf去完成转换操作,该库的安装命令如下: pip install docx2pdf 目标:读取文件夹下的全部word文件,然后进行转换,最后保存到对应的文件夹中...上面的word转pdf已经教大家学会了从文件夹中读取全部的文件,所有这里同样的就不再赘述。 pip install pywin32 目标:excel文件转为PDF ?...=os.path.abspath("Python学习规划路线.pptx") output_file_path=os.path.abspath("Python学习规划路线.pdf") #创建...) slides.Close() 这里将会ppt:Python学习规划路线.pptx转为Python学习规划路线.pdf ?

1K30

Python快速将任意文件转为PDF

今天辰哥就教大家任意文件批量转为PDF,这里以日常办公的word、excel、ppt为例,这三种格式的文件转为PDF。...01、word转PDF 这里借助Python的docx2pdf去完成转换操作,该库的安装命令如下: pip install docx2pdf 目标:读取文件夹下的全部word文件,然后进行转换,最后保存到对应的文件夹中...+"/"+word_name.replace("docx","pdf")) 其中word_path是存放word文件文件夹,word_to_pdf是转换后的pdf存放文件夹。...pip install pywin32 目标: excel文件转为PDF [up-62f1d3f624d4d77b35002936b233b3f1502.png] 这里辰哥新建一个excel文件作为演示...slides.SaveAs(output_file_path,32) slides.Close() 这里将会ppt:Python学习规划路线.pptx转为Python学习规划路线.pdf [up

1K10

Python+Selenium下载网盘特定标题的PDF文件

我想要从百度云网盘上下载一些有特定标题的PDF文件,用来做数据分析。但是百度云网盘的下载速度很慢,而且有些文件需要付费才能下载。...所以我决定Python和Selenium来写一个爬虫程序,自动化地搜索和下载我想要的文件。为了防止被百度云网盘检测到,我还使用了代理IP来隐藏我的真实IP地址。...文件的标题(请替换为你想要的标题) title = "your_title" search_input = wait.until(EC.visibility_of_element_located((By.ID...文件并点击 pdf_files = driver.find_elements_by_css_selector(".file-name .file-name-text") for pdf_file in...pdf_files: if pdf_file.text.endswith(".pdf"): pdf_file.click() break # 点击下载按钮 download_button

42820

python中有多个对应的库可以操作Pdf文件,其中最常用的是Pypdf2

python中有多个对应的库可以操作Pdf文件,其中最常用的是Pypdf2PyPDF是一个操作pdf的模块,现在最常用的版本是PyPDF2;需要注意的是,这个库不能操作pdf获取文字信息PyPDF2介绍...PyPDF2 是一个纯 Python PDF 库,可以读取文档信息(标题,作者等)、写入、分割、合并PDF文档,它还可以对pdf文档进行添加水印、加密解密等操作。...文件的基本信息,还可以获取到每一pdf并加载为PageObject对象;from PyPDF2 import PdfFileReader #引入readerpdf = PdfFileReader(input_path...文件添加页面 该页面通常是从一个PdfFileReader实例中获取的pdfWriter.addPage(pdfReader.getPage(0))# insertBlankPage 空白插入此...','wb'))3、重要的概念PageObject:在PdfFileReader加载pdf文件后,获取的每一都会被转换为PageObject对象,对于Pdf的操作,实际就是在操作PageObject对象

82410
领券