首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

用python将多页pdf文件拆分成多个pdf文件?

您好!您的问题是关于如何使用Python将多页PDF文件拆分成多个PDF文件。

在这种情况下,您可以使用一个名为PyPDF2的Python库。PyPDF2是一个用于处理PDF文件的库,可以用来合并、拆分和提取PDF文件的信息。

以下是使用PyPDF2将多页PDF文件拆分成多个PDF文件的示例代码:

代码语言:python
代码运行次数:0
复制
import PyPDF2

# 打开PDF文件
with open('input.pdf', 'rb') as file:
    pdf_reader = PyPDF2.PdfFileReader(file)

    # 获取PDF文件的页数
    num_pages = pdf_reader.numPages

    # 循环遍历每一页
    for page_num in range(num_pages):
        # 创建一个新的PDF文件
        pdf_writer = PyPDF2.PdfFileWriter()

        # 添加当前页到新的PDF文件
        pdf_writer.addPage(pdf_reader.getPage(page_num))

        # 将新的PDF文件保存到文件中
        with open(f'output{page_num}.pdf', 'wb') as output:
            pdf_writer.write(output)

这段代码将会将输入的多页PDF文件拆分成多个单页PDF文件,并将它们保存到当前目录中。

希望这个答案能够帮助您解决问题!

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

使用python合并多个pdf文件

今天需要整理一份资料,需要把多个pdf合并为一个,wps这些软件自然是有这个功能,但一般都是收费的,百度上也有很多网站,但资料上传到别人的网站,始终觉得还是不太可靠,故自己搜索了一下使用python来处理...pdf文件,故此分享这个方法 python处理pdf需要用到一个PyPDF2的库,故首先安装这个第三方库 安装这些第三方库推荐使用国内的源,比如清华、豆瓣、百度、华为等 pip install PyPDF2...target_path = r'pdf' ## pdf目录文件 pdf_lst = [f for f in os.listdir(target_path) if f.endswith('.pdf'...() for pdf in pdf_lst: file_merger.append(pdf,import_bookmarks=False) # 合并pdf文件 file_merger.write...(r"合并文件.pdf") 注意一下: 合并的时候,pdf_lst 是根据文件的名称来排序生成,如果对于pdf文件合成顺序有要求,建议吧文件按照期望的合成顺序编号1 2 3这样,方便一些 比如像下面这种

2.1K10
  • 使用Python合并任意多个PDF文件

    在工作中,经常会遇到合并pdf文件的需求,这时候你会发现不是一件很容易完成的任务。包括WPS、福昕阅读器在内的很多软件都有合并pdf文件的功能,但是只有交钱变成会员之后才能使用,否则只能合并3页。...有不少网站提供了在线合并pdf文件的功能,但也是必须交钱才能用。还有的显示合并成功,但就是无法下载。如果你会一点Python,就会发现这是一件很容易的事,并且不用花一分钱。...功能描述: 使用Python合并任意多个PDF文件。 详细步骤: 1、安装扩展库PyPDF2。 ? 2、编写代码。 ?...3、把代码中pdf_files的内容改成自己要合并pdf文件名,运行代码,一眨眼,合并完成。

    4.4K20

    【拆分PDF重命名】将PDF按页拆分多个PDF文件,并用PDF里文字对文件批量重命名,python和腾讯api识别改名的完整代码和详细步骤

    一个典型的场景是,一个多页的 PDF 文件包含了多个不同主题或信息单元,而用户希望将其按页拆分成多个单独的 PDF 文件,以便于更方便地管理、存储和检索这些信息。...以下是使用 Python 和腾讯云 OCR API 实现将 PDF 按页拆分多个 PDF 文件并用 PDF 里文字对文件批量重命名完整步骤和代码示例:步骤 1:准备工作安装必要的库:PyPDF2:用于拆分...tencentcloud-sdk-python:腾讯云 Python SDK,用于调用腾讯云 OCR 服务。pdf2image:用于将 PDF 页面转换为图像,以便进行 OCR 识别。...(input_pdf_path): """ 将 PDF 按页拆分为多个 PDF 文件 :param input_pdf_path: 输入的 PDF 文件路径 :return: 拆分后的...然后在终端中运行以下命令:bashpython pdf_split_and_rename.py代码说明split_pdf 函数:将输入的 PDF 文件按页拆分为多个单独的 PDF 文件。

    9310

    使用Python将一个Excel文件拆分成多个Excel文件

    标签:Python,pandas库,openpyxl库 本文展示如何使用Python将Excel文件拆分为多个文件。拆分Excel文件是一项常见的任务,手工操作非常简单。...将示例文件直接读入pandas数据框架: 图1 该数据集一些家电或电子产品的销售信息:产品名称、产地、销售量。我们的任务是根据“产品名称”列将数据拆分为不同的文件。...基本机制很简单: 1.首先,将数据读入Python/pandas。 2.其次,应用筛选器将数据分组到不同类别。 3.最后,将数据组保存到不同的Excel文件中。...最后,可以将每个数据集保存到同一Excel文件中的单独工作表中。...图4 图5 使用Python拆分Excel工作簿为多个Excel工作簿 如果需要将数据拆分为不同的Excel文件(而不是工作表),可以稍微修改上面的代码,只需将每个类别的数据输出到自己的文件中。

    3.7K31

    Excel实战技巧43: 将多个PDF文件中指定页面合并成一个PDF文件

    学习Excel技术,关注微信公众号: excelperfect 在《Python实战01:合并多个PDF文件》和《Python实战02:分别合并多个相似文件名的PDF文件》中,我们使用Python代码对...图3 在上图3所示的工作表中,在每个PDF文件名相邻的单元格,输入要合并的PDF文件页码,如果要合并多页,则用逗号分隔开。...例如,数字2表明要合并文件“完美Excel.pdf”的第2页,数字2,6表明要合并文件“汇总.pdf”的第3页和第6页,如下图4所示。 ?...图4 下面的代码将取出要合并的PDF文件中的页面并保存为一个单独的PDF文件: Sub SplitPDFFilesIntoSinglePages() '引用 :Adobe Acrobat 10.0 Type...文件所在的文件夹,因为我们将拆出的单独的PDF文件放置在了“合并的文件”文件夹中,应此选该文件夹,如下图6所示。

    6.6K72

    用Python玩转PDF | 批量拆分文件

    如果一个PDF文件页数较多,导致体积较大,可以将其拆分成几个部分,以方便阅读。那么如何拆分?今天继续分享使用Python编写程序来完成PDF文件的批量拆分。 这里采用按固定页数进行拆分的方式。...例如,假设按每份5页进行拆分,那么一个27页的PDF文件会被拆分成6份(27/5=5.4≈6),第1~5份均为5页,第6份为2页。仍然使用PyPDF2模块来拆分PDF文件。...src, size): in_dir = Path(src) all_pdf_file = list(in_dir.glob('*.pdf')) for pdf in all_pdf_file...拆分函数,需要两个参数,一个为PDF文件目录src,一个为拆分页数size,也就是多少页文件拆分为一个文件。...程序运行后,会把文件目录下所有满足条件的PDF文件,进行拆分,也可以理解为文件批量拆分。

    73420

    零代码编程:用ChatGPT提取PDF文件一页中的多个表格

    零代码编程:用ChatGPT提取PDF文件一页中的多个表格 一个PDF文件中,有好几个表格,要全部提取出来,该怎么做呢?...在ChatGPT中输入提示词: 写一段Python代码: 使用PdfPlumber库提取“F:\北交所全部上市公司的招股说明书20230710\艾能聚.pdf”第174页中的所有表格, 保存第1个表格到...save_to_excel(data, file_path): df = pd.DataFrame(data) df.to_excel(file_path, index=False) print(f"表格内容已保存到文件...(file_path) as pdf: for i, page_num in enumerate(page_num_list): page = pdf.pages[page_num - 1] tables...= r"F:\北交所全部上市公司的招股说明书20230710\艾能聚.pdf" page_num_list = [174] output_folder = r"F:" extract_tables_from_pdf

    12510

    软件测试|教你用Python处理PDF文件(三)

    前言 我们之前介绍了提取PDF文件中的文字内容,我们使用PyPDF2即可实现操作,但是如果PDF文件有图片的话,只提取文本的话无法把图片的内容一起提取出来,我们需要另外的脚本来实现对图片的提取。...使用实例 我们提取PDF文件中的图片的代码如下: import PyPDF2 from PIL import Image def extract_images_from_pdf(pdf_path,...() # 使用示例 pdf_path = 'files/test2.pdf' # PDF文件路径 output_folder = 'files' # 图片输出的文件夹路径 extract_images_from_pdf...(pdf_path, output_folder) 运行脚本,发现files文件夹新增了两个jpg文件,如下: 图片 图片如下: 图片 总结 本文主要介绍了使用PyPDF2库实现对PDF文件中的图片进行提取的操作...,后续我们将介绍提取PDF文件中的表格内容。

    21940

    软件测试|教你用Python处理PDF文件(四)

    前言 之前我们介绍了从PDF文件中提取文本内容以及从PDF文件提取图片的方法,除了文本内容与图片,表格也PDF文件中常见的内容,提取表格内容时,我们不再使用PyPDF2库来实现操作,Python有多个库来实现提取表格内容...,本文我们将分别介绍多个库提取PDF中表格的操作。...,可以通过这个特点将一段的文本整合 表格数据抽取:不会被换行数据所干扰 但是,它也不是完美的,缺点如下: 进行文本抽取时,如果一页有文本和表格,那么抽取的文本数据也会包括表格数据 对于有合并单元格的表格..., pages='all') return tables # 使用示例 pdf_path = 'files/test.pdf' # 替换为实际的PDF文件路径 extracted_tables...总结 本文主要介绍了Python提取PDF表格内容的方法,如果我们只提取表格内容的话,使用tabula-py会更为理想一些。

    38320

    软件测试|教你用Python处理PDF文件(一)

    但是PDF文件的内容复制并不方便,要是能够使用Python将内容取出来的话,就会很舒服了!本文就来给大家介绍一下Python处理PDF文件的方法。...环境与资源准备 Python有一个非常优秀的处理PDF的第三方库——PyPDF2,这是一个开源免费的库,用于处理PDF文件,能够实现对PDF文件的分离、合并、裁剪、转换、加密、解密等操作。...安装如下: pip install PyPDF2 资源准备 我们创建了一个PDF文件,文件名为test.pdf,文件第一页内容为拜仁慕尼黑,第二页主要内容为两张图片,第三页主要内容为一个表格。...' # 将待拼接的pdf文件以绝对路径的形式放在一个列表里 pdf_list = [f for f in os.listdir(src_path) if f.endswith('.pdf')] pdf_list...Python读取PDF文件以及合并多个PDF文件,为PDF文件添加水印功能的实现,后续我们将为大家介绍为PDF加密与解密的操作。

    29720

    软件测试|教你用Python处理PDF文件(二)

    前言 上一篇文章我们介绍了Python使用pypdf2实现读取PDF文件的文本内容,合并PDF文件,以及为PDF文件添加水印,本篇文章我们来介绍使用Python实现对PDF文件的加密解密。...PDF文件加密,python支持给PDF文件加密,代码如下: from PyPDF2 import PdfReader, PdfWriter reader = PdfReader("files/test.pdf...") writer = PdfWriter() # 拷贝每一页的内容 for page in reader.pages: writer.add_page(page) # 在新的pdf文件中添加密码...= PdfWriter() # 解密 if reader.is_encrypted: reader.decrypt("secret-password") # 将每一页内容加到writer对象中...") as f: writer.write(f) 运行脚本后,我们可以新增了一个test_decrypted.pdf,可以直接点击查看文件内容,如下: 图片 总结 本文主要为大家介绍了使用Python

    21020

    【随笔】用 Python 轻松提取、合并和压缩 PDF 文件

    在日常的工作或项目中,PDF 文件处理往往是非常常见的任务。例如,你可能需要从一个大的 PDF 文件中提取特定的页面、根据内容合并页面,或者将这些文件压缩以减小存储空间。...今天,我将介绍一个利用 Python 实现的自动化脚本,它不仅能够提取 PDF 内容,还能合并相同内容的页面,并在完成后压缩生成的文件。...在这篇博客中,我将展示如何通过以下步骤实现 PDF 文件的批量处理: 提取每一页的第二行内容。 根据内容将相同页面合并为一个 PDF。 压缩最终生成的 PDF 文件。...接下来,使用 PyPDF2 的 PdfWriter 将这些页面合并成一个新的 PDF 文件。...总结 通过这篇文章,你已经学会了如何使用 Python 脚本自动化处理 PDF 文件:提取特定页面内容、合并相同内容的页面并压缩最终文件。

    21700

    用Python快速将任意文件转为PDF

    今天辰哥就教大家将任意文件批量转为PDF,这里以日常办公的word、excel、ppt为例,这三种格式的文件转为PDF。...01 word转PDF 这里借助Python的docx2pdf去完成转换操作,该库的安装命令如下: pip install docx2pdf 目标:读取文件夹下的全部word文件,然后进行转换,最后保存到对应的文件夹中...上面的word转pdf已经教大家学会了从文件夹中读取全部的文件,所有这里同样的就不再赘述。 pip install pywin32 目标:将excel文件转为PDF ?...=os.path.abspath("Python学习规划路线.pptx") output_file_path=os.path.abspath("Python学习规划路线.pdf") #创建...) slides.Close() 这里将会ppt:Python学习规划路线.pptx转为Python学习规划路线.pdf ?

    1.2K30

    用Python快速将任意文件转为PDF

    今天辰哥就教大家将任意文件批量转为PDF,这里以日常办公的word、excel、ppt为例,这三种格式的文件转为PDF。...01、word转PDF 这里借助Python的docx2pdf去完成转换操作,该库的安装命令如下: pip install docx2pdf 目标:读取文件夹下的全部word文件,然后进行转换,最后保存到对应的文件夹中...+"/"+word_name.replace("docx","pdf")) 其中word_path是存放word文件的文件夹,word_to_pdf是转换后的pdf存放文件夹。...pip install pywin32 目标: 将excel文件转为PDF [up-62f1d3f624d4d77b35002936b233b3f1502.png] 这里辰哥新建一个excel文件作为演示...slides.SaveAs(output_file_path,32) slides.Close() 这里将会ppt:Python学习规划路线.pptx转为Python学习规划路线.pdf [up

    1.2K10
    领券