前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >用Python玩转PDF | 批量合并文件

用Python玩转PDF | 批量合并文件

作者头像
TalkPython
发布2022-11-21 13:28:32
1.1K0
发布2022-11-21 13:28:32
举报
文章被收录于专栏:TalkPythonTalkPython

有很多工作场景,你需要把多个PDF文件合并一个。也有很多软件可以完成多个PDF文件的合并,但不够灵活。更加灵活的方式,通过Python编写程序自己实现。

今天要分享的内容便是,通过Python程序合并多个PDF文件。我们还是使用Python第三方模块PyPDF2来操控PDF文件,该模块能完成PDF文件的信息提取、拆分、合并、页面裁剪、加密/解密等多种操作。我在后续将继续分享其他操作。

在开始之前,你需要安装好PyPDF2第三方模块。以下程序就是合并多个PDF文件的程序。

代码语言:javascript
复制
from pathlib import Path
from PyPDF2 import PdfFileReader, PdfFileMerger

# 合并PDF
def merger_pdf_file(src, dst):   
    in_dir = Path(src)
    out_dir = Path(dst) 
    if not out_dir.parent.exists():
        out_dir.mkdir(parents=True)
    all_pdf_file = list(in_dir.glob('*.pdf'))
    merger = PdfFileMerger()
    for pdf in all_pdf_file:
        pdf_reader = PdfFileReader(str(pdf))
        merger.append(pdf_reader)
    merger.write(str(out_dir))
    merger.close()

合并函数,有两个参数,分别为需要合并PDF文件目录和合并后文件名称。首先,调用路径对象的parent属性返回父目录(即保存文件夹)的路径,并判断该目录是否存在。如果不存在,则创建该目录。

然后,获取所有要合并的PDF文件的路径,并遍历PDF文件进行合并。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2022-08-21,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 TalkPython 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档