【weakfilescan】敏感文件扫描工具

weakfilescan

基于爬虫,动态收集扫描目标相关信息后进行二次整理形成字典规则,利用动态规则的多线程敏感信息泄露检测工具,支持多种个性化定制选项,包括:

  • 规则字典多样化定义(支持正则、整数、字符、日期)
  • 扫描域名策略(域名全称、主域名、域名的名字)
  • 自定义HTTP状态码
  • 支持动态配置HTTP脚本扩展名
  • 自定义判断文件是否存在正则
  • 返回结果集误报清洗选项
  • HTTPS服务器证书校验
  • 线程数定义
  • HTTP请求超时时间
  • 是否允许URL重定向
  • 是否开启Session支持,在发出的所有请求之间保持cookies
  • 是否允许随机User-Agent
  • 是否允许随机X-Forwarded-For
  • 动态代理列表配置(支持TOR)
  • HTTP头自定义

更多使用详情参照 /config.py

快速开始

python wyspider.py http://wuyun.org php

字典支持规则

规则使用简介

在字典中使用规则引擎,必须以 { 括号开头,并以 }$ 结尾,类型后面跟的 # 代表生成数据的长度,$ 代表单步值,开始-结束,数据的起始区间设置。

{规则=类型#长度$step:开始-结束}$

规则

说明

re

正则引擎

int

整数

str

字符

date

日期

正则引擎类型

使用实例 {re=引擎名称:正则表达式}$

{re=exrex:[0-9]}$[u'0', u'1', u'2', u'3', u'4', u'5', u'6', u'7', u'8', u'9']
{re=exrex:[aA]dmin[1-5]}$[u'admin1', u'admin2', u'admin3', u'admin4', u'admin5', u'Admin1', u'Admin2', u'Admin3', u'Admin4', u'Admin5']

整数类规则

类型

使用实例

顺序递进 处理step

{int=series$单步值:开始数字-结束数字}$

{int=series$2:0-10}$[0, 2, 4, 6, 8, 10]

类型

使用实例

连号数字

{int=digits#长度:开始数字-结束数字}$

{int=digits#3:0-9}$[123, 234, 345, 456, 567, 678, 789]

类型

使用实例

重叠数字

{int=overlap#长度:开始数字-结束数字}$

{int=overlap#4:0-9}$ [1111, 2222, 3333, 4444, 5555, 6666, 7777, 8888, 9999]

字符类规则

类型

使用实例

顺序递进 处理step

{str=letters#长度:开始字符-结束字符}$

{str=letters#3:a-g}$['abc', 'bcd', 'cde', 'def', 'efg']

类型

使用实例

重叠字母

{str=overlap#长度:开始字符-结束字符}$

{str=overlap#4:a-g}$['aaaa', 'bbbb', 'cccc', 'dddd', 'eeee', 'ffff', 'gggg']

日期类规则

类型

使用实例

{date=year:开始年份-结束年份}$

{date=year:2010-2015}$[2010, 2011, 2012, 2013, 2014, 2015]

类型

使用实例

{date=mon:开始月份-结束月份}$

{date=mon:01-12}$[1, 01, 2, 02, 3, 03, ‘...’, 9, 09]

类型

使用实例

{date=day:开始日-结束日}$

{date=day:01-31}$[1, 01, 2, 02, 3, 03, 4, 04, 5, 05, ‘...’, 31]

类型

使用实例

年月

{date=year_mon:开始年月-结束年月}$

{date=year_mon:201501-201504}$[201501, 20151, 201502, 20152, ‘...’, 201504]

类型

使用实例

月日

{date=mon_day:开始月日-结束月日}$

{date=mon_day:0501-0531}$[0501, 51, 0502, 52, 0506, 56, 0511, 511, ‘...’, 0530,530]

类型

使用实例

年月日

{date=year_mon_day:开始年月日-结束年月日}$

{date=year_mon_day:20150101-20150401}$[20150101, 201511, 20150112, 2015112, ‘...’, 20150401]

类型

使用实例

月日年

{date=mon_day_year:开始月日年-结束月日年}$

{date=mon_day_year:01012015-04012015}$[01012015, 112015, 01122015, 1122015, ‘...’, 04012015]

安装

CentOS 6.* 7.* Linux

安装 setuptools, pip

wget https://bootstrap.pypa.io/ez_setup.py -O - | python
wget https://pypi.python.org/packages/source/p/pip/pip-6.0.8.tar.gz
tar zvxf pip-6.0.8.tar.gzcd pip-6.0.8
python setup.py install

安装 lxml解析器 & beautifulsoup4

yum install python-devel libxml2-devel libxslt-devel
pip install lxml beautifulsoup4

原文发布于微信公众号 - 网络安全社区悦信安(yuexin_an)

原文发表时间:2017-11-23

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏python3

习题18:命名,变量,代码,函数

1. 首先告诉python创建一个函数,使用的命令是def,也就是定义(define)的意思

832
来自专栏landv

C语言_函数【转】

4683
来自专栏xingoo, 一个梦想做发明家的程序员

数字按照不同格式转换成字符串

  如果自己写函数,不使用itoa怎么判断呢?   我们用通常的办法,对数字进行每位的除商,得到后与字符'0'相加。 flag = 0; ...

21210
来自专栏知道一点点

sass入门学习篇(二)

一,sass有两种后缀名文件:一种后缀名为sass,不使用大括号和分号;另一种就是我们这里使用的scss文件,建议scss.

1062
来自专栏后端技术探索

实用篇-无处不在的Location

location配置是nginx模块化配置中最出色的一个设计,几乎所有nginx的业务场景都要通过书写多个location配置来顺应业务需要。语法配置和执行规则...

1212
来自专栏Young Dreamer

简易前端模板引擎

模板解析 解决的问题: 将data和js+html片段解析成html片段,完成赋值和js逻辑,如下所示: 输入: var data = {     name: ...

21710
来自专栏黑泽君的专栏

java基础学习_面向对象(上)03_day08总结

============================================================================= ==...

791
来自专栏null的专栏

Python技巧——list与字符串互相转换

在Python的编程中,经常会涉及到字符串与list之间的转换问题,下面就将两者之间的转换做一个梳理。 1、list转换成字符串 命令:list() 例子: ?...

2673
来自专栏苦逼的码农

Shell编程 --- 变量

(2).如果按作用范围的话,可分为自定义变量和环境变量(后面会将自定义变量和环境变量)。

1065
来自专栏青玉伏案

窥探Swift编程之错误处理与异常抛出

在Swift 2.0版本中,Swift语言对其错误处理进行了新的设计,当然了,重新设计后的结果使得该错误处理系统用起来更爽。今天博客的主题就是系统的搞一下Swi...

2045

扫码关注云+社区

领取腾讯云代金券