前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >使用python合并多个pdf文件

使用python合并多个pdf文件

作者头像
用户9925864
发布2022-07-27 09:41:51
2K0
发布2022-07-27 09:41:51
举报
文章被收录于专栏:算法工程师的学习日志

今天需要整理一份资料,需要把多个pdf合并为一个,wps这些软件自然是有这个功能,但一般都是收费的,百度上也有很多网站,但资料上传到别人的网站,始终觉得还是不太可靠,故自己搜索了一下使用python来处理pdf文件,故此分享这个方法

python处理pdf需要用到一个PyPDF2的库,故首先安装这个第三方库

安装这些第三方库推荐使用国内的源,比如清华、豆瓣、百度、华为等

代码语言:javascript
复制
pip install PyPDF2 -i https://pypi.tuna.tsinghua.edu.cn/simple

然后根据这个库处理pdf

代码语言:javascript
复制
import os
from PyPDF2 import PdfFileMerger

target_path = r'pdf'  ## pdf目录文件
pdf_lst = [f for f in os.listdir(target_path) if f.endswith('.pdf')]
pdf_lst = [os.path.join(target_path, filename) for filename in pdf_lst]

file_merger = PdfFileMerger()
for pdf in pdf_lst:
    file_merger.append(pdf,import_bookmarks=False)     # 合并pdf文件

file_merger.write(r"合并文件.pdf")

注意一下:

合并的时候,pdf_lst 是根据文件的名称来排序生成,如果对于pdf文件合成顺序有要求,建议吧文件按照期望的合成顺序编号1 2 3这样,方便一些

比如像下面这种

在当前目录就生成好了对应的文件

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-05-12,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 算法工程师的学习日志 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档