专栏首页Python小屋Python+pymupdf“擦除”PDF文件中的任意内容

Python+pymupdf“擦除”PDF文件中的任意内容

任务描述:

给定一个PDF文件,在指定位置绘制一个白色的无框矩形,相当于“擦除”该位置的内容。

准备工作:

安装扩展库pymupdf,参考:Python+pymupdf处理PDF文档案例6则

参考代码:

原PDF文件第一页内容:

处理后PDF文件第一页内容,箭头所指处是被覆盖的内容:

原PDF文件第二页内容:

处理后PDF文件第二页内容:

看上去效果不错,那么问题来了,内容真的被删除了吗?如果没有的话有什么办法看到被“擦除”的内容呢?

本文分享自微信公众号 - Python小屋(Python_xiaowu),作者:董付国

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2021-07-11

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • Python脚本工具,PyMuPDF批量提取PDF文件中的图片

    如何批量快速提取出PDF中的图片文件,你是否遇到这样的一个问题,尤其是PPT文件转换为PDF文件,需要快速提取其中的图片文件,如果你恰好会那么一点py,同时复制...

    二爷
  • PDF 的各种操作,我用 Python 来实现(附网站和操作指导)

    PDF 处理是日常工作中的常见需求,包括 PDF 合并、删除、提取等。更复杂的任务如:将 PDF 转换成 图像。

    机器视觉CV
  • PyQt5 从零开始制作 PDF 阅读器(一)

    此前,我已经写了三篇关于 Ui 界面的文章,分别是:猜数游戏、计时器程序和天气查询软件。这次,我们使用 Python 实现 PDF 阅读器。

    用户2870857
  • 别再问如何用Python提取PDF内容了!

    大家好,在之前的办公自动化系列文章中我们已经详细介绍了?如何使用Python批量处理PDF文件,包括合并、拆分、水印、加密等操作。

    刘早起
  • 利用python将PDF批量转成图片

    因为工作上的需求,需要将PDF转成图片,在网络上寻找了一些PDF转图片的方法,但是如若想要免费使用的话,限制太多,如:限制转换页数,像素过低等,干脆考虑...

    文科生的python自学之路
  • GUI实战|Python做一个文档图片提取软件

    本文将进一步讲解如何用Python提取PDF与Word中图片,并结合之前讲解过的GUI框架PysimpleGUI,做一个多文件图片提取软件,效果如下:

    刘早起
  • 批量比较两个PDF文档(PDFUtil通过文本/者图像进行比较)

    在我的项目中,我需要比较大量的PDF文档,确认两份PDF文档是否一致,如果仅仅凭借着手动去逐一比较,可能很快就阵亡了。另外也有一些软件可以辅助的去对比,但依然是...

    软测小生
  • Python将PDF转成图片—PyMuPDF和pdf2image

    前言:在最近的测试中遇到一个与PDF相关的测试需求,其中有一个过程是将PDF转换成图片,然后对图片进行测试。

    软测小生
  • Python将PDF转成图片—PyMuPDF和pdf2image

    粗略的试了好几种方式,其中语言尝试了Python和Java,总体而言所找到的Python方式相对比Java更快一些,更简单一些。

    萌海无涯
  • 三种方法,Python轻松提取PDF中全部图片

    今天就跟大家系统分享几种Python提取 PDF 图片的方法。其实没有非常完美的方法,每种方法提取效率都不是百分之百,因此可以考虑用多种方法进行互补,主要将涉及...

    刘早起
  • Python 图片与pdf相互转换

    py3study
  • Python提取PDF第一页为封面图片【批量提取】

    近期要处理一批PDF文件,大约在20G,具体数量不详,需求是把每个文件的页数和第一页转换成图片,在网上查阅各种类库,最终选择的是PyMuPDF模块。最后核心代码...

    小白程序猿
  • Python将PDF转成图片PNG和JPG

    前言:在最近的测试中遇到一个与PDF相关的测试需求,其中有一个过程是将PDF转换成图片,然后对图片进行测试。

    软测小生
  • 使用Python提取PDF文件里的内容

    PDF文件,是我们工作和学习中经常见到的文件。阅读体验非常好。 常用的Python操作PDF文件的第三方库,包含pyPdf、pyPdf2、pyPdf3、pyPd...

    TalkPython
  • 40行代码自己动手写pdf转word小工具(文末附工具下载)

    今天咱们介绍一个pdf转word的免费小工具,满足这么一个不常见但是偶尔会出来烦人的需求!

    可以叫我才哥
  • R语言提取PDF文件中的文本内容

    综上步骤,我们便可以随便获取任意章节的任意内容。那么接下来就是对这些文字的应用,各位集思广益吧。

    一粒沙
  • Python把PDF文件中每页内容分离为独立图片文件

    封面图片:《Python程序设计实验指导书》(ISBN:9787302525790),董付国,清华大学出版社

    Python小屋屋主
  • Python工具源码,Python批量提取PPT文件中的图片

    在办公场景当中,同样也有这样一个需求,那就是快速批量把PPT文件中的图片提取出来,毕竟一个个点击另存为太过于繁琐,以及耗费时间,前面本渣渣分享过如何应用Pyth...

    二爷
  • 兄弟,不要偷看人家摄像头

    我是程序员小贱

扫码关注云+社区

领取腾讯云代金券