专栏首页渗透云笔记Web渗透之网站信息、域名信息、端口信息、敏感信息及指纹信息收集

Web渗透之网站信息、域名信息、端口信息、敏感信息及指纹信息收集

作者介绍:杨秀璋

自幼受贵州大山的熏陶,养成了诚实质朴的性格。经过寒窗苦读,考入BIT,为完成自己的教师梦,放弃IT、航天等工作,成为贵财一名大学教师,并想把自己所学所感真心传授给自己的学生,帮助更多陌生人。

一.Web渗透第一步

网站是一个安装在电脑上的应用程序,它有操作系统、应用程序以及服务器。例如WAMP包括:

Web服务器:Apache

数据库:MySQL

编程语言:PHP

网站HTML站点访问的基本流程如下图所示:客户端输入访问URL,DNS服务器会将域名解析成IP地址,接着IP地址访问服务器内容(服务器、数据库、应用程序),最终将内容反馈至客户端的浏览器。

数据库包括要调用的数据,并存储在Web服务器上,这台服务器有真实的IP地址,每个人都能访问、Ping通它。每次页面请求或运行程序时,Web应用程序在服务器上执行,而不是在客户的机器上。

那么,如何入侵一个网站呢?

入侵安装在计算机上的应用程序称为Web应用渗透测试,入侵带操作系统的计算机和应用程序称为服务端攻击,入侵人称为社会工程学攻击。在我们进行Web渗透之前,不是拿到目标就开始使用Webdirscan、SQLMAP等工具,而是需要先获取网站的指纹信息,获取的信息越多,越容易找到背后的漏洞或注入点。常见的搜集信息包括:

IP地址

域名信息(邮箱、联系人、地址、电话)

技术使用(框架、服务器、数据库、编程语言)

在同一台服务器上的其他网站\旁站

DNS记录

文件、子域、目录

这篇文章就将简单Web渗透的第一步操作——常见信息收集方法,希望读者们喜欢。

二.域名信息收集

1.域名查询

域名系统

域名系统(英文:Domain Name System,缩写:DNS)是互联网的一项服务。它作为将域名和IP地址相互映射的一个分布式数据库,能够使人更方便地访问互联网。简单来说就是一个将域名翻译成ip地址的系统。

域名是由一串用点分割的名字组成的Internet上某一台计算机或计算机组的名称,用于在数据传输时标识计算机的电子方位。浏览网站的过程如下图所示,从DNS服务器中获取指定域名对应的IP地址。

域名解析

举一个例子,zh.wikipedia.org作为一个域名就和IP地址198.35.26.96相对应。DNS就像是一个自动的电话号码簿,我们可以直接拨打198.35.26.96的名字zh.wikipedia.org来代替电话号码(IP地址)。DNS在我们直接调用网站的名字以后就会将像zh.wikipedia.org一样便于人类使用的名字转化成像198.35.26.96一样便于机器识别的IP地址。再如51cto.com域名,edu.51cto.com和www.51cto.com是该域名对应的子域名,而edu和www是对应的主机名。

2.Whois查询

Whois是用来查询域名的IP以及所有者等信息的传输协议。简单说,Whois就是一个用来查询域名是否已经被注册,以及注册域名的相信的数据库(如域名所有人、域名注册商)。

不同域名后缀的Whois信息需要到不同的Whois数据库查询,如.com的Whois数据库和.edu的不同。每个域名或IP的Whois信息由对应的管理机构保存,例如以.com结尾的域名的Whois信息由.com运营商VeriSign管理,中国国家顶级域名.cn由CNNIC(中国互联网信息中心)管理。

Whois协议基本内容是:先想服务器的TCP端口43建立一个连接,发送查询关键字并加上回车换行,然后接收服务器的查询结果。

通过Whois查询可以获得域名注册者邮箱地址等信息,一般情况下对于中小型网站域名注册者就是网站管理员,利用搜索引擎对Whois查询到的信息进行搜索,获取更多域名注册者的个人信息。

Whois查询方法:

(1) Web接口查询

常见的网站包括:

Whois站长之家查询:http://whois.chinaz.com/

Whois Lookup 查找目标网站所有者的信息:http://whois.domaintools.com/

Netcraft Site Report 显示目标网站上使用的技术:http://toolbar.netcraft.com/site_report?url=

Robtex DNS 查询显示关于目标网站的全面的DNS信息:https://www.robtex.com/

全球Whois查询:https://www.whois365.com/cn/

站长工具爱站查询:https://whois.aizhan.com/

(2) 通过Whois命令查询

在Kali Linux下自带的Whois查询工具,通过命令Whois查询域名信息。

(3) Python撰写Whois代码

接着作者使用Robtex DNS 查询网站相关信息,显示如下所示,它增加了IP地址内容(60.205.24.36),再通过网站能定位物理地址。

IP地址:60.205.24.36

Host名称:www

Mail servers:mxn.mxhichina.com、mxw.mxhichina.com

Netcraft Site Report显示目标网站信息如下,包括网站搭建框架和操作系统。

OS:Windows Server 2008

Web服务器:Microsoft IIS/7.5

3.备案信息查询

ICP备案是指网络内容提供商(Internet Content Provider),《互联网信息服务管理办法》指出需要对网站进行备案,未取得许可不得从事互联网信息服务。

IPC备案查询方法包括:

https://www.beian88.com/

http://beian.miit.gov.cn/publish/query/indexFirst.action

https://www.tianyancha.com/

http://www.beianbeian.com/

比如作者和Bilibili网站的备案信息如下图所示:

三.Web站点信息收集

1.CMS指纹识别

CMS(内容管理系统)又称为整站系统或文章系统,用于网站内容管理。用户只需要下载对应的CMS软件包,就能部署搭建,并直接利用CMS。但是各种CMS都具有其独特的结构命名规则和特定的文件内容,因此可以利用这些内容来获取CMS站点的具体软件CMS与版本。常见的CMS包括Discuz、Dedecms(织梦)、PhpCMS、WordPress等。

常见识别工具:

(1) 在线工具

http://whatweb.bugscaner.com/look/

http://www.yunsee.cn/finger.html

he.bgp.net

(2) 本地工具

御剑Web指纹识别程序、大禹CMS识别程序(https://github.com/Ms0x0/Dayu)等。

示例:

以某站为例,通过 http://whatweb.bugscaner.com/look/ 网站识别指纹,发现它是Discuz搭建的。信息包括:

CMS:Discuz! X3.4

ip地址:210.42.xx.xx

编程语言:PHP

服务器:Apache 2.4.23

操作系统:Windows Server

物理地址:xxx省xxx市xxx路

Web服务器扩展:OpenSSL

接下来将Github上面的大禹下载至本地,并进行CMS扫描。

2.CMS漏洞查询

对于查询到的CMS可以利用乌云漏洞库网站查询制定CMS的漏洞。

http://www.anquan.us/

https://bugs.shuimugan.com

显示如下图所示,包括详细的漏洞利用过程及防御措施。

3.敏感目录信息

针对目标Web目录结构和敏感隐藏文件探测是非常重要的,在探测过程中很可能会探测到后台页面、上传页面、数据库文件,甚至是网站源代码文件等。常见的探测工具包括:

御剑后台扫描工具

wwwscan命令行工具

dirb命令工具

dirbuster扫描工具

参考:

[网络安全自学篇] 八.Web漏洞及端口扫描之Nmap、ThreatScan和DirBuster工具

[网络安全自学篇] 十七.Python攻防之构建Web目录扫描器及ip代理池(四)

御剑

御剑系列的web工具一直是比较顺手的工具。这款御剑也是很好用的网站后台扫描工具,图形化页面,使用起来简单上手,因此也被大多数人所喜好。其作者可能是“御剑孤独”。

Dirb 通过暴力破解来发送请求,什么时候找到了就发告诉我们找到了。

DirBuster

Kali Linux提供的目录扫描工具DirBuster支持全部的Web目录扫描方式。它既支持网页爬虫方式扫描,也支持基于字典暴力扫描,还支持纯暴力扫描。该工具使用Java语言编写,提供命令行(Headless)和图形界面(GUI)两种模式。用户不仅可以指定纯暴力扫描的字符规则,还可以设置以URL模糊方式构建网页路径。同时,用户还对网页解析方式进行各种定制,提高网址解析效率。

4.WordPress测试

WordPress是使用PHP语言开发的博客平台,用户可以在支持PHP和MySQL数据库的服务器上架构属于自己的网站,也可以把WordPress当作一个内容管理系统CMS来使用。针对WordPress测试,可以使用WpScan工具对其进行安全测试。

WpScan

例如识别 https://cn.wordpress.org/ 官方网站的框架信息,可以调用whatwep命令或在线网站获取其CMS信息。

如果发现目标网站是WordPress搭建,再使用WPScan进行检测。

四.端口信息收集

1.端口介绍

如果把IP地址比作一间房子,端口就是出入这间房子的门。真正的房子只有几个门,但是一个IP地址的端口可以有65536(2 ^ 16)个门之多。端口是通过端口号来标记的,端口号只有整数,范围从0到65536(2 ^ 16 - 1 )。

计算机常见的端口号包括:

HTTP服务器默认端口号为:80/tcp(木马Executor开放此端口)

HTTPS服务器默认端口号为:443/tcp、443/udp

Telnet(远程登录)默认端口号为:23/tcp(木马Tiny Telnet Server所开放的端口)

FTP默认端口号为:21/tcp(木马Doly Trojan、Fore、Invisible FTP、WebEx、WinCrash等所开放的端口)

TFTP(Trivial File Transfer Protocol)默认端口号为:69/udp

SSH(安全登录)、SCP(文件传输)、端口号重定向,默认端口号为:22/tcp

SMTP(E-mail)默认端口号为:25/tcp(木马Antigen、Email Password Sender、Haebu Coceda、Shtrilitz Stealth、WinPC、WinSpy都开放这个端口)

POP3 Post Office Protocol(E-mail)默认端口号为:110/tcp

Webshpere应用程序默认端口号为:9080

TOMCAT默认端口号为:8080

MySQL数据库默认端口号为:3306

Oracle 数据库默认的端口号为:1521

WIN2003远程登录默认端口号为:3389

MS SQL*SERVER数据库server默认的端口号为:1433/tcp、1433/udp

在计算机中每个端口代表一个服务,在Windows命令行中使用 netstat -ano | netstat -anbo显示开放端口。

CMD中需要管理员权限打开,并输入netstat -anbo查看开放的端口。其中,443端口是HTTPS建立的连接,80端口是网站HTTP建立的连接。

2.端口信息采集

对于收集目标及其端口状况可以使用工具来进行,其工作原理都是使用TCP或UDP等协议向目标端口发送指定标志位等数据包,等待目标返回数据包,以此来判断端口状态。后续作者,准备通过Python编写相关的代码。

这篇文章主要通过工具采集端口信息,包括:

使用Nmap采集,命令为:nmap -A -v -T4 目标

使用masscan采集,命令为:masscan -p80 目标

示例:

查看本地端口开放情况,命令为:nmap -A -v -T4 192.168.1.1

使用masscan探测端口开放信息,命令为:masscan -p80 192.168.1.1/24 --rate=10000

使用工具通常会在目标网站留下痕迹,接下来提供一种在线网站探测方法。

在线网站:http://tool.chinaz.com/port/

ThreatScan在线网站:https://scan.top15.cn/

示例:

使用站长之家探测作者网站的80端口开放,443端口关闭。(最早支持多个端口扫描,当前只支持单一端口扫描,如果读者能自行编写程序更好)。

接下来复习前面的文章,采用ThreatScan在线网站扫描作者的网站信息。

作者确实只开放了80端口访问网页和FTP端口21。

3.端口攻击

针对不同的端口具有不同的攻击方法,因为每个端口就是记录服务器或目标系统的大门,只要打开这个大门,就可以进入目标系统。例如:针对远程连接服务端口的攻击方法如下,因为23号端口Telnet远程连接是明文传递信息的,可以通过爆破、嗅探、弱口令等方法实施攻击。

这里推荐大家:当我们扫描到目标网站的端口号时,可以在搜索引擎中查找对应的攻击方法进行测试,也可以在乌云漏洞库(http://www.anquan.us/)或CVE库中搜索。例如:

注意:CVE漏洞被再利用是网络攻击常见的手段,提醒生产厂商第一时间打补丁,用户使用部分软件的版本更新也是非常必要的。

4.防御措施

对于端口攻击来说,只要端口开放并且可以连通,就可以利用对应的方式进行攻击测试。这里提供的防御措施包括:

关闭不必要的端口;

对重要业务的服务端口设置防火墙;

加强员工信息安全意识,经常性更换用户密码,避免弱口令爆破;

经常更新软件,打补丁(Patch);

利用CVE网站的漏洞信息,提高自身网站的安全。

五.敏感信息收集

针对某些安全做得很好的目标,直接通过技术层面是无法完成渗透测试的。在这种情况下,可以利用搜索引擎目标暴露在互联网上的关联信息。例如:数据库文件、SQL注入、服务配置信息,甚至是通过Git找到站点泄露源代码,以及Redis等未授权访问、Robots.txt等敏感信息,从而达到渗透目的。

在某些情况下,收集到的信息会对后期进行测试起到帮助重要。如果通过收集敏感信息直接获取了目标系统的数据库访问权限,那么渗透测试任务就结束了一大半。因此在进行技术层面情况下的测试之前,应该先进行更多的信息收集,尤其是针对敏感信息的。

1.Google Hacking语法

Google Hack是指使用Google、百度等搜索引擎对某些特定网站主机漏洞(通常是服务器上的脚本漏洞)进行搜索,以达到快速找到漏洞主机或特定主机的漏洞的目的。常见方法包括:

Google提供了强大的搜索功能,可以获取精准的结果。如果访问不了,也可以通过百度获取相关内容,但是结果远没有谷歌精准,很多无关的广告及视频会返回给你。示例如下:

intitle:eastmount 搜索网页标题包含eastmount字符的网页。

inurl: login.asp?id= 搜索包含特定字符“login.asp?id=”的URL。常用示例为inurl:login.asp、inurl:asp?id=、inurl:login.asp。

intext:cbi

搜索网页正文内容包含特定字符cbi的网页。

filetype:ppt

搜索制定类型的文件,返回所有以ppt结尾的文件URL。

site:baidu.com

找到与指定网站有联系的URL。

Google Hacking数据库为:https://www.exploit-db.com/google-hacking-database/

例如,查询数据Access数据库,使用 filetype:mdb “standard jet”(password | username | user | pass)。

2.HTTP响应收集Server信息

通过HTTP或HTTPS与目标站点进行通信中,目标响应的报文中Server头和X-Powered-By头会暴露目标服务器和使用的编程语言信息,通过这些信息可以有针对的利用漏洞尝试。

获取HTTP响应的基本方法包括:

利用工具,如浏览器审计工具、BurpSuite、Fiddler等代理截断工具获取。

编写Python脚本文件,如requests库。

参考作者前文:

[网络安全自学篇] 三.Burp Suite工具安装配置、Proxy基础用法及暴库示例

[网络安全自学篇] 七.快手视频下载之Chrome浏览器Network分析及Python爬虫探讨

[网络安全自学篇] 十四.Python攻防之基础常识、正则表达式、Web编程和套接字通信(一)

右键浏览器审查元素,获取Network中Headers信息。

Python的核心代码如下:

3.Github信息泄露

Github是一个分布式的版本控制系统,拥有大量的开发者用户。随着越来越多的应用程序转义到云端,Github已经成为了管理软件开发以及发现已有代码的首选方法。当今大数据时代,大规模数据泄露事件时有发生,但有些人不知道很多敏感信息的泄露其实是我们无意之间造成的。一个很小的疏漏,可能会造成一系列的连锁放映。Github上敏感信息的泄露,就是一个典型的例子,存在着一些安全隐患。

例如,我们可以使用Github找到邮件配置信息泄露,涉及一些社会工程学。

site:Github.com smtp

site:Github.com smtp @qq.com

再如,通过Github获取数据库泄露信息。

site:Github.com sa password

site:Github.com root password

site:Github.com User ID=‘sa’

通过Github探索SVN信息泄露信息。

site:Github.com svn

site:Github.com svn username

最后,通过Github搜索综合泄露信息。

site:Github.com password

site:Github.com ftp ftppassword

site:Github.com 密码

site:Github.com 内部

综合泄露信息一个例子如下图所示(网图)。

同样,其他网站信息也可以参考上述的方法,并推荐大家使用Google浏览器。当然,更多敏感信息可以通过dirb等工具来获取,它通过暴力破解来发送请求,找到时会发请求告诉我们。

六.真实IP地址识别

1.CDN

CDN全称是Content Delivery Network,即内容分发网络。其原理如下:

某些大型网站在全国都会有很多用户,这些用户常常会向网站发送不同的请求,那么不同地域会具有不同的缓冲服务器来接收用户发送的流量。如果用户发送流量没有任何交互的数据,只是请求首页的话,此时根据用户所在地区来确定访问的高速缓存服务器,高速缓存服务器会返回对应的响应到用户的浏览器当中,比如广东。

当用户填写数据,需要交互时才会将请求发送到真实的服务器;此时通过广东省的缓存服务器来连接真实服务器。

CDN通常存在用户很多的大型流量网站,通过它来解决我们服务器的瓶颈。

2.判断CDN存在

可以通过Ping来判断网站是否存在CDN,比如 http://www.xxxx.com/ 。

显示如下图所示,可以看到百合网是存在CDN的。

也可以通过设置代理或利用在线Ping网站来使用不同地区的Ping服务器来测试目标。

http://ping.chinaz.com/

该网站显示结果如下图所示:

可以看到使用不同的Ping服务器,响应的IP地址是不同的。不同的监测点相应的IP地址不同,由此也可以推断当前网站使用了CDN技术。

3.绕过CDN

那么确定使用CDN之后,如何绕过CDN呢? 如果目标没有使用CDN: 可以直接利用ping获取IP地址,或者利用在线网站获取(如 http://www.ip138.com)。例如作者网站使用Ping和在线网站获取的IP地址是一样的,这也表明作者没有使用CDN。

如果目标使用CDN: 需要绕过CDN来后去真实IP地址,方法如下:

内部邮箱源:收集到内部邮箱服务器IP地址

网站phpinfo文件:phpinfo.php

分站IP地址,查询子域名:CDN很贵,很有可能分站就不再使用CDN

国外访问:https://asm.ca.com/en/ping.php

查询域名解析记录:https://viewdns.info/

当然,还有其他的方法,也推荐读者去尝试学习。

通过国外网站获取IP地址:

通过国内网站(https://viewdns.info/)获取IP地址:

4.验证IP地址

通过上面的方法获取了很多的IP地址,此时我们需要确定哪一个才是真正的IP地址,具体方法如下:

利用IP地址对Web站点进行访问,如果正常表名是真实IP地址,否则是假的。

例如,输入 view-source:123.xxx.xxx.39,表示真实的IP地址。

更多方法希望读者自行去学习。同时,绿色网络需要大家共同维护,本文更希望大家了解背后的原理及防御措施,一定不要去恶意测试别人的网站,违者后果自负。

七.总结

希望这系列文章对你有所帮助,后续作者也将继续深入学习,制作一些常用的小工具供大家交流。如果文章对您有帮助,请点个赞,哈哈!未来一起加油,共同进步。

本文分享自微信公众号 - 渗透云笔记(shentouyun),作者:杨秀璋

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2020-04-11

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • Ubuntu Server 第八章 DNS服务

    这章的内容为DNS服务,远程管理一章中使用PUTTET,利用Hosts文件是域名指向对方IP,其实就已经涉及到了DNS。

    天钧
  • 【实战XOX】测试中国香港某药业注入漏洞

    于是我随意的在网上找到了中国香港的一个药业网站,起先没什么,也只是看看。突然发现是存在漏洞的!!!

    天钧
  • 渗透基础之浅谈HTTP请求(小白文)

    但是光有了工具还仅仅是不够的,正所谓:工欲善其事,必先利其器”熟练掌握工具,还要看懂里面传达的信息,那么下面就为带大家讲解一些相关知识:

    天钧
  • 记一次真实的网站被黑经历

    距离上次被DDOS攻击已经有10天左右的时间,距离上上次已经记不起具体那一天了,每一次都这么不了了之。然而近期一次相对持久的攻击,我觉得有必要静下心来,分享一下...

    猿天地
  • Python第二天 (数据类型,变量 )

    在Python中,等号=是赋值语句,可以把任意数据类型赋值给变量,同一个变量可以反复赋值,而且可以是不同类型的变量,例如:

    py3study
  • 《牧场星球》登陆国内第一家网鱼VR线下店,掀起排队热潮

    VRPinea
  • Redis缓存Java对象使用Fastjson序列化Json字符串报ClassCastException

        项目基础框架为:springboot2.x,mybatis(redis作为二级缓存)    

    尚浩宇
  • JDK1.9-常用类Object

    版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。

    cwl_java
  • WCF认证:X.509证书1 非对称密码学(Asymmetric Cryptography)二、数字证书三、通过凭证三个属性来分析X.509证书

    站在消息交换的角度,密码学就是帮助我们实现对整个消息或者对消息的某个部分进行数字签名和加密的理论和方法

    JavaEdge
  • 帝都魔都无处逃离?大数据带你寻找春日“有氧”生活

    腾讯位置服务

扫码关注云+社区

领取腾讯云代金券