首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >Python+pymupdf处理PDF文档案例6则

Python+pymupdf处理PDF文档案例6则

作者头像
Python小屋屋主
发布2020-07-21 16:11:42
发布2020-07-21 16:11:42
4.4K0
举报
文章被收录于专栏:Python小屋Python小屋

任务描述:

  1. 提取PDF文件中的文本,保存为文本文件
  2. 合并PDF文档
  3. 把PDF文档按页转换、拆分成独立图片,每页一个图片文件
  4. 合并多个图片为PDF文件,每个图片占一页
  5. 提取PDF中的所有图片,保存为独立的图片文件
  6. 在PDF文件指定位置添加文本注释
  7. 为PDF文件中的关键字添加高亮、下画线、删除线

测试文件内容:

安装扩展库:

参考代码:

提取的文本:

合并的PDF文件

拆分的图片和提取出来的图片文件:

合并的图片式PDF文件内容:

加注释以后的效果:

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-07-20,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Python小屋 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档