“
同样的操作,为什么会出现不同的结果?百度知道上,“周围人还关注”到底是什么?如何使用Fiddler解密网站数据?本期“安仔课堂”,ISEC实验室的吴老师,来为我们解答~
首先,我们试验下“周关”出现的概率
思路是获取百度知道页面的访问链接地址,重放访问请求,然后统计页面结果,使用Fiddler 完成这个试验。
Fiddler简介:Fiddler,全称Progress Telerik Fiddler Web Debugger,http/https调试分析工具。点这里查看Fiddler详细介绍:Fiddler基础教程
打开 Fiddler,设置允许远程连接代理和https解密;
在测试手机上设置Fiddler的代理ip和端口,这里使用的是Android手机。
在手机上安装Fiddler证书,否则访问https站点时会提示证书安全问题。
配置好之后,在手机上浏览网页,Fiddler上便能看到手机所有网页浏览数据了。找到浏览百度知道页面的会话(Session),按住Shift点击工具栏上的“Replay”,输入回放次数100。
这样便获得了访问百度知道100次的页面,在这些页面中查找包含“周围人还关注”这几个文字的会话数。
以此方法测试几个关键字,得到如下结果:
从结果可以看出:“周关”出现的概率与搜索的关键字有关,有的关键字中出现的概率很高(88%),有的概率很低(1%)。
接下来,我们分析下“周关”内容
以下是某次访问“《唐诗三百首》第一首作者是谁”出现的“周关”词条:
共有8个词条,点击这些词条,进入了百度优选,如下图:
其中“唐诗幼儿早教”、“唐诗300首全集下载”及“唐诗三百首幼儿早教” 是与搜索关键字有直接关系的,另外5个词条关系很小或没有直接关系。
那么,这些不相关的词条的出现,是否跟手机位置有关系呢?因为访问百度知道时,手机浏览器并没有提示网站在请求手机当前位置,故需要考虑,是否跟访问的ip有关系。
”
下面,进行第二个试验
“
先用刚才的Android手机获取100个“周关”的词条,然后在Fiddler上设置使用境外代理,再用另一只iPhone手机通过Fiddler获取100次“周关”词条。
分别将这两次获得的会话导出,保存成txt,写一个小程序统计两次试验出现的词条及次数,如下:
接下来,继续使用Fiddler在有代理的网络下,每次获取1000次“周关”词条,然后检查左边表格中的词条是否都在这些词条中出现。
在试验到3000次时,左边表格,即未使用代理网络时获取的“周关”词条,都通过代理网络获取到了,说明这些词条的出现跟访问ip没有关系。
”
欢迎大家于文末留言,
分享你的宝贵见解、
疑问、补充~
领取专属 10元无门槛券
私享最新 技术干货