专栏首页进击的Coder实用脚本!利用 Python 对 PDF 进行加密、解密操作,代码拿走就用!

实用脚本!利用 Python 对 PDF 进行加密、解密操作,代码拿走就用!

这是「进击的Coder」的第 420 篇技术分享

作者:陈熹

来源:早起Python

阅读本文大概需要 6 分钟。

本文将分享如何利用 Python 对 PDF 进行加密和解密操作,主要利用到之前多次介绍过的PyPDF2 模块。

PDF 加密

在之前的文章PDF合并、拆分、水印、加密中简单提到过加密一个 PDF 文件的方法,我们先拿自己随意的一个PDF 文件试一下:

from PyPDF2 import PdfFileWriter, PdfFileReader
path = r'C:\xxx' # 这里填写目标 PDF 所在的路径

pdf_reader = PdfFileReader(path + r'\test.pdf')
pdf_writer = PdfFileWriter()

for page in range(pdf_reader.getNumPages()):
    pdf_writer.addPage(pdf_reader.getPage(page))
pdf_writer.encrypt('a123') # 设置密码为 a123
with open(path + r'\test.pdf', 'wb') as out:
    pdf_writer.write(out)

上面代码的运行逻辑是:实例化一个 PDF 写入器和读取器,读取器读取完目标 PDF 文件后,一页一页交给写入器,然后对写入器设置密码并输出。看一下运行结果:

可见这个 PDF 文件成功设置上了密码,如果有多个PDF需要加密,可以写一个简单的循环利用上述脚本批量处理,此处不再展开说明。

PDF 已知密码解密

如果知道密码的情况下,想直接取消 PDF 的加密,可以用 .decrypt,解密的过程需要读取器和写入器共同配合。但区别于加密 .encrypt.decrypt 是针对读取器进行解密的,而不是写入器

from PyPDF2 import PdfFileWriter, PdfFileReader
path = r'C:\xxx'

pdf_reader = PdfFileReader(path + r'\test.pdf')
pdf_reader.decrypt('a123') #
pdf_writer = PdfFileWriter()

for page in range(pdf_reader.getNumPages()):
    pdf_writer.addPage(pdf_reader.getPage(page))
with open(path + r'\test.pdf', 'wb') as out:
    pdf_writer.write(out)

上面代码的运行逻辑是:首先用读取器读取加密文件,然后直接在读取器上使用 .decrypt 进行解密,逐页传到刚实例化的写入器后统一输出,就完成了解密

PDF 暴力解密

暴力破解,其实就是通过手上已经有的密码库,或者完全通过数字、字母、符号的穷举,将可能的密码都放进去,逐个尝试直到成功。

「目前暴力破解只适用于已知密码位数少,由简单的数字、字母构成」

假设今天要破解的密码就是 a123,已知密码 4 位且由数字和小写字母组成。破解又分为两种情况:

1. 手上有密码本

第一种情况,知道大概密码,可以整理成一个 password.txt ,保证可能的密码一定在其中:

首先读取 .txt 文件获取其中所有密码(示例文件只有 9 个密码):

passw = []
path = r'C:\Scientific Research\Python'
file = open(path + r'\password.txt')
for line in file.readlines():
    passw.append(line.strip())
print(passw)
file.close()

然后就可以用密码本的密码做暴力破解:

from PyPDF2 import PdfFileReader

passw = []
path = r'C:\xxx'
file = open(path + r'\password.txt')
for line in file.readlines():
    passw.append(line.strip())
file.close()

path = r'C:\xxx'
pdf_reader = PdfFileReader(path + r'\test).pdf')

for i in passw:
    if pdf_reader.decrypt(i):
        print(f'破解成功,密码为{i}')
    else:
        print(f'破解不成功,密码{i}错误')

2. 手术无密码本,完全穷举

首先介绍 itertools,可以构建含需要组合的生成器供后续迭代:

import itertools
mylist = ("".join(x) for x in itertools.product("0123456789abcdef", repeat=4))
print(next(mylist))

利用这个方法就可以用 while 循环尝试暴力破解(为了减少时间,生成器用"abc123"生成组合):

import itertools
from PyPDF2 import PdfFileReader

mylist = ("".join(x) for x in itertools.product("123abc", repeat=4))
path = r'C:\xxx'
pdf_reader = PdfFileReader(path + r'\test.pdf')

while True:
    i = next(mylist)
    if pdf_reader.decrypt(i):
        print(f'破解成功,密码为{i}')
        break
    else:
        print(f'破解不成功,密码{i}错误')

可以看到最后也成功破解了,但需要注意:但即使是这么简单的组合也耗费了一点时间,如果复杂的密码破解难度和破解时间就指数级增长了,暴力的穷举法就不一定适用,可以根据需求具体调整规则,缩小范围再进行尝试。

End

本文分享自微信公众号 - 进击的Coder(FightingCoder)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2021-05-21

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 教你用Python 操作 PDF 的几种方法

    大家好,有关 Python 操作 PDF 的案例之前已经写过一个?PDF批量合并,这个案例初衷只是给大家提供一个便利的脚本,并没有太多讲解原理,其中涉及的就是 ...

    CDA数据分析师
  • 最全总结!聊聊 Python 操作PDF的几种方法(合并、拆分、水印、加密)

    大家好,有关Python操作PDF的案例之前已经写过一个?PDF批量合并,这个案例初衷只是给大家提供一个便利的脚本,并没有太多讲解原理,其中涉及的就是PDF处理...

    刘早起
  • Python自动化(二十) | 聊聊 Python 操作PDF的几种方法(合并、拆分、水印、加密)

    大家好,有关Python操作PDF的案例之前已经写过一个?PDF批量合并,这个案例初衷只是给大家提供一个便利的脚本,并没有太多讲解原理,其中涉及的就是PDF处理...

    龙哥
  • Python编程快速上手——PDF文件操作案例分析

    – 程序内函数1需要做以下事情: 找出文件夹中所有PDF文件 对PDF文件进行加密 保存加密的PDF文件 检验是否正确加密 删除源文件 – 程序内函...

    砸漏
  • HackTheBox chaos writeup

    大家好,我是大白,鉴于在强网杯中受到了打击,决定努力提升一下自己姿势水平,先去hackthebox刷一波退役靶机

    用户2202688
  • lucky 勒索病毒分析与文件解密

    近日,互联网上爆发了一种名为 lucky 的勒索病毒,该病毒会将指定文件加密并修改后缀名为 .lucky。

    Seebug漏洞平台
  • CTF取证方法大汇总,建议收藏!

    站在巨人的肩头才会看见更远的世界,这是一篇来自技术牛人的神总结,运用多年实战经验总结的CTF取证方法,全面细致,通俗易懂,掌握了这个技能定会让你在CTF路上少走...

    用户7886150
  • 如何使用Python玩转PDF各种骚操作?

    Portable Document Format(可移植文档格式),或者PDF是一种文件格式,可以用于跨操作系统的呈现和文档交换。尽管PDF最初是由Adobe发...

    猴哥yuri
  • 如何使用Python玩转PDF各种骚操作?

    Portable Document Format(可移植文档格式),或者PDF是一种文件格式,可以用于跨操作系统的呈现和文档交换。尽管PDF最初是由Adobe发...

    小小詹同学
  • Python玩转PDF各种骚操作大全!

    Portable Document Format(可移植文档格式),或者PDF是一种文件格式,可以用于跨操作系统的呈现和文档交换。尽管PDF最初是由Adobe发...

    一墨编程学习
  • 如何使用Python玩转PDF各种骚操作?

    Portable Document Format(可移植文档格式),或者PDF是一种文件格式,可以用于跨操作系统的呈现和文档交换。尽管PDF最初是由Adobe发...

    Python数据科学
  • 用Python玩转PDF的各种骚操作

    Portable Document Format(可移植文档格式),或者PDF是一种文件格式,可以用于跨操作系统的呈现和文档交换。尽管PDF最初是由Adobe发...

    诸葛青云
  • 运维自动化基础建设|系统环境初始化

    小B拿到需求之后,开始编写Shell脚本,一顿操作猛如虎,总算在其中一台机器上安装好了php环境,这个时候小A又过来说,不好意思啊,小B,我刚才少说了一点,我们...

    追马
  • 123个Python黑客工具,再也不用问女朋友要手机密码了

    今天的文章来源于dloss/python-pentest-tools,本文中列举了123个Python渗透测试工具,当然不仅于渗透~ 下面我们就开始吧~ ———...

    小小科
  • 123个Python黑客工具,再也不用问女朋友要手机密码了

    今天的文章来源于dloss/python-pentest-tools,本文中列举了123个Python渗透测试工具,当然不仅于渗透~

    马哥linux运维
  • 手把手 | 20行Python代码教你批量将PDF转为Word

    大数据文摘
  • 遇到需要的登录的网站怎么办?学好python,用这3招轻松搞定!

    一墨编程学习
  • 浅谈Python在CTF中的运用

    现在大部分的程序猿对网络安全这个领域几乎一点都不了解,不要问为什么,我接触过很多程序猿(有不少是大厂优秀的程序猿,甚至没有一点安全意识,对网络安全这个领域也没什...

    安恒网络空间安全讲武堂
  • 专为渗透测试人员设计的 Python 工具大合集

    如果你对漏洞挖掘、逆向工程分析或渗透测试感兴趣的话,我第一个要推荐给你的就是Python编程语言。Python不仅语法简单上手容易,而且它还有大量功能强大的库和...

    企鹅号小编

扫码关注云+社区

领取腾讯云代金券