pydictor 爆破字典生成指南

pydictor 是一个使用 python 语言开发,遵循 GPLv3 协议的开源命令行工具,主要用来帮助安全研究人员生成称心如意的暴力破解字典。

以功能强大、简洁实用、适用场景多、自定义程度强为开发目标。

开源地址:

https://github.com/LandGrey/pydictor

点击阅读原文查看项目。

0x01:特点与功能

今天主要是讲 pydictor 如何结合渗透测试过程常见的场景使用,特点与功能:

https://github.com/LandGrey/pydictor/blob/master/README_CN.md

有详细讲解,下面只梳理一下大概脉络,方便下文的理解。

特点:

1.完全使用 python 的原生库写成,不需要额外安装其它任何的 python 模块;

2.同时支持 python 2.7+ 和 python 3.4+ 版本,可在 Windows、Linux 和 Mac 平台上运行;

3. 可自定义化程度高,留出很多可配置规则的文件;

4. 爆破必备,新老皆宜.

功能:

1.基于三大字符集(d: 数字 L: 小写字母 c: 大写字母)的基础字典;

2.基于自定义字符集(包括特殊字符)的字典;

3.排列组合字典(几个字符或字符串的所有排列可能);

4.用配置文件或者符合 pydictor 字典语法的字符串直接生成字典;

5.析取网页中可能有意义的原始单词字典;

6.基于关键词生成针对性密码字典;

7.基于性别生成中国公民身份证后 4/6/8 位字典;

8.生成一段时间内的生日字典(自定义位数);

9.用 pydictor 的 handler 功能润色下自己的字典;

10.基于个人信息和规则生成社会工程学字典(呃,蹭下知名度,本质还是基于关键词,重在密码规则模式)

11.一系列和字典的整个生命周期有关的内置工具;包括字典合并、合并后去重、字典去重、单词频率统计、安全擦除字典;

12.一系列和生成优化字典有关的选项; 包括自定长度范围、字典加前缀、加后缀、编码或加密字典、用 1337 模式、控制字典所用规则的程度、根据数字、字符和特殊字符的个数或种类的多少来筛选字典、用正则表达式来筛选字典等。

0x02:使用场景

早期开发是为了让功能匹配使用场合,后期开发是让具体场景拥有对应的功能。

01:字典合并

字典都不是凭空捏造或生成的,一般都会参考前辈们公布的字典。所以,先收集百八十个字典,放到一个目录下,把字典合并起来吧。

1. 合并目录/网站路径爆破字典

2. 合并子域名字典

3. 合并用户名字典

4. 合并弱密码字典

5. 其它各式各样的字典

python pydictor.py -tool combiner /my/dict/dirpath -o comb.txt

02:词频统计

但是有时候我们通常不需要那么大的字典,选合并后字典的出现频率最高的前1000条保存吧。筛选出

最常用的网站路径/子域名/用户名/弱密码/...

修改 lib/data/data.py 中 counter_split 变量指定的分隔符 ( 默认 "\n" ),也可以统计其它字符分隔的字典词频.

python pydictor.py -tool counter vs comb.txt 1000

03:去除重复项

面对合并后的超大字典,还是不舍得只要频率高的词,路径字典有时候还是多多益善。去重下,照单全收

python pydictor.py -tool uniqifer comb.txt --output uniq.txt

或者直接合并加去重

python pydictor.py -tool uniqbiner /my/dict/dirpath --output uniq.txt

04:枚举数字字典

准备好字典了,拿最基础的试试手

1.爆破 4 位或 6 位数字手机短信验证码

2.爆破用户名ID值

生成 4 位纯数字字典

python pydictor.py -base d --len 4 4

05:简单用户名字典

不能确定是否存在某用户时,试试 1 位到 3 位的拼音字典,加上 123456 这样的几个弱口令,说不定就有意外收获:

python pydictor.py -base L --len 1 3 -o dict.txt

06:后台管理员密码字典(明文传输)

经常遇到的测试场景了,就是一个登录页,把收集到的信息都用上,生成后台爆破字典,比如

域名: test.land.com.cn

编辑名: 张美丽、Adaor、midato

公司名: 上海美丽大米有限责任公司(如有雷同纯属巧合)

座机: 568456

地址: xxx 园区 A 座 312 室

把自己常用的弱口令字典复制到 wordlist/Web 目录下,最终生成的字典会包含它们;

然后把下列信息写入 /data.txt

test land zhangmeili meili zml Adaor midato meilidami mldm shmldm 568456 A312

生成字典:

python pydictor.py -extend /data.txt --level 3 --len 4 16

弱口令字典 + 部分信息 + 生成规则 + level3,最终生成了七万多条密码,一部分密码如下:

07:后台管理员密码字典(前台普通加密)

有时候网站的密码可能不是直接明文传输过去的,程序员会用 js 简单加密下再传输过去,比如 base64 编码、md5 加密,这时候可以用 --encode 参数生成加密字典

python pydictor.py -extend /data.txt --level 3 --len 4 16 --encode b64

python pydictor.py -extend /data.txt --level 3 --len 4 16 --encode md5

08:后台管理员密码字典(前台js自定义加密)

高级点的程序员,还喜欢前端自定义个 js 加密方法,把用户名和密码加密后传输过去,比如

这时候,普通爆破工具基本都无能为力了,但是却依旧可以通过 pydictor 来生成字典;

修改 /lib/fun/encode.py 文件的 test_encode() 函数,用 python 语法仿照上图的加密方式再实现一遍加密:

然后运行命令,生成按照前端js加密方法加密后的密码字典,可以直接用burpsuite加载

python3 pydictor.py -extend /data.txt --level 3 --len 4 16 --encode test

最后通过这种方式生成符合前端加密方法的用户名字典,先探测出存在的用户名,再结合几个弱密码,爆破出来 100 多个弱口令。

需要注意的是,一般生成加密字典前要生成一个没加密的字典,因为每一项在文件中的顺序是一致的,所以爆破出来密码后,可以通过行数对照去没加密的字典中查找明文。

09:复杂格式的字典

例如,你通过 shoulderhack 和一些信息,猜到别人的密码大概是

Cxhai【三位或四位数字】_abc123@【qq,163,wy,mail 中的一个】,然后 md5 加密的值

这种复杂格式的字典,pydictor 也可以轻松的生成

python pydictor.py --conf "Cxhai[0-9]{3,4}<none>_abc123@[qq,163,wy,mail]{1,1}<none>" --encode md5

没加密前的字典:

最终加密后的字典:

10:社会工程学字典

通过配置文件定义的规则和一部分内置代码逻辑,你可以输入一些关于个人的信息,生成关于某个人可能用的密码,比如,我只知道一个的如下信息

姓名: 景林

生日:1997 年 7 月 16 日

以前用过密码:Jlin520

然后一波操作,生成了四万多条密码

嫌密码太多了?没事,只要长度 6-16 的,级别设置大点,密码会少很多;

查看下当前配置,重新生成字典,只有三千多条了

11:处理自己的字典

退一万步来讲,上面的字典都帮不了你,但是 pydictor 的 handler 功能还是可以帮你根据具体的使用场景来处理自己的字典,让自己原本的字典适用各种场合。

比如:

对方密码策略要求是 6 到 16 位;必须有数字和字母,不允许有特殊字符;前端 js 对密码 base64 编码后传输到后端。

可以用下面的命令处理自己原先的字典 raw.txt,生成符合本次爆破场景的字典:

python pydictor.py -tool handler /wordlist/raw.txt --len 6 16 --occur ">0" ">0" "<=0" --encode b64 -o /wordlist/ok.txt

0x03:结语

pydictor 的常见使用场景都简单介绍过了,另外还有一些特殊字典,比如身份证后几位、生日日期字典;内置的专门用来破解 SSH 弱口令的键盘模式字典

https://github.com/LandGrey/pydictor/blob/master/wordlist/Sys/SSH_Root_Weak_Pass.txt

等等,就不一一介绍了,相信自己看看就能理解。

结合目标的爆破场景,合理使用 pydictor,人人都是爆破小能手。

原文发布于微信公众号 - 信安之路(xazlsec)

原文发表时间:2017-11-24

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏FreeBuf

如何把SQLMap里的功能移植到自己的程序中?

不知道各位有没有听过不要重复造轮子?因为有些开源的工具,它们经过时间和众人的捶打,其实会比我们自己一个人造出来的轮子考虑的更加周到和全面。可是有时候有些开源工具...

21370
来自专栏编程

看我是如何把SQLMap里的功能移植到我的程序的

不知道各位有没有听过不要重复造轮子?因为有些开源的工具,它们经过时间和众人的捶打,其实会比我们自己一个人造出来的轮子考虑的更加周到和全面。可是有时候有些开源工具...

216100
来自专栏蜉蝣禅修之道

EJBCA使用之注册用户及创建证书

30040
来自专栏大闲人柴毛毛

轻量级线程池的实现

写在前面 最近因为项目需要,自己写了个单生产者-多消费者的消息队列模型。多线程真的不是等闲之辈能玩儿的,我花了两个小时进行设计与编码,却花了两天的时间调试与运...

53740
来自专栏java一日一条

能让你少写1000行代码的20个正则表达式

正则表达式,一个十分古老而又强大的文本处理工具,仅仅用一段非常简短的表达式语句,便能够快速实现一个非常复杂的业务逻辑。熟练地掌握正则表达式的话,能够使你的开发效...

10420
来自专栏梧雨北辰的开发录

iOS面试知识总结之基本概念总结

凡经历过iOS面试的我们总会发觉,即使实际开发中做过许多项目,也难免为一个普通的面试题受挫。这也许不是因为我们技术不过关,而是因为在平时我们忽略了怎样将用到的知...

42070
来自专栏古时的风筝

用java开发微信公众号:公众号接入和access_token管理(二)

上一篇说了微信开发的准备工作,准备工作完成之后,就要开始步入正题了。其实微信公众号开发,说白了,就是要构造和发送http或https的请求组成,并根据请求的返回...

58960
来自专栏运维一切

ceph对象存储折腾记 原

###前言 一直想弄对象存储,以前弄过一次,不是很理解region是个什么东西,后来时间和工作上的原因没有再折腾,这两天闲了下来,再次折腾了一次。我是参考的ce...

17410
来自专栏H2Cloud

C++中消息自动派发之一 About JSON

1. 闲序   游戏服务器之间通信大多采用异步消息通信。而消息打包常用格式有:google protobuff,facebook thrift, 千千万万种自定...

26630
来自专栏FreeBuf

Windows内核漏洞CVE-2016-0143分析

0x00 背景 4月20日,Nils Sommer在exploitdb上爆出了一枚新的Windows内核漏洞PoC。该漏洞影响所有版本的Windows操作系统,...

24060

扫码关注云+社区

领取腾讯云代金券