学习
实践
活动
专区
工具
TVP
写文章

“百度知道”上的“周关”到底是什么?

同样的操作,为什么会出现不同的结果?百度知道上,“周围人还关注”到底是什么?如何使用Fiddler解密网站数据?本期“安仔课堂”,ISEC实验室的吴老师,来为我们解答~

首先,我们试验下“周关”出现的概率

思路是获取百度知道页面的访问链接地址,重放访问请求,然后统计页面结果,使用Fiddler 完成这个试验。

Fiddler简介:Fiddler,全称Progress Telerik Fiddler Web Debugger,http/https调试分析工具。点这里查看Fiddler详细介绍:Fiddler基础教程

打开 Fiddler,设置允许远程连接代理和https解密;

在测试手机上设置Fiddler的代理ip和端口,这里使用的是Android手机。

在手机上安装Fiddler证书,否则访问https站点时会提示证书安全问题。

配置好之后,在手机上浏览网页,Fiddler上便能看到手机所有网页浏览数据了。找到浏览百度知道页面的会话(Session),按住Shift点击工具栏上的“Replay”,输入回放次数100。

这样便获得了访问百度知道100次的页面,在这些页面中查找包含“周围人还关注”这几个文字的会话数。

以此方法测试几个关键字,得到如下结果:

从结果可以看出:“周关”出现的概率与搜索的关键字有关,有的关键字中出现的概率很高(88%),有的概率很低(1%)。

接下来,我们分析下“周关”内容

以下是某次访问“《唐诗三百首》第一首作者是谁”出现的“周关”词条:

共有8个词条,点击这些词条,进入了百度优选,如下图:

其中“唐诗幼儿早教”、“唐诗300首全集下载”及“唐诗三百首幼儿早教” 是与搜索关键字有直接关系的,另外5个词条关系很小或没有直接关系。

那么,这些不相关的词条的出现,是否跟手机位置有关系呢?因为访问百度知道时,手机浏览器并没有提示网站在请求手机当前位置,故需要考虑,是否跟访问的ip有关系。

下面,进行第二个试验

先用刚才的Android手机获取100个“周关”的词条,然后在Fiddler上设置使用境外代理,再用另一只iPhone手机通过Fiddler获取100次“周关”词条。

分别将这两次获得的会话导出,保存成txt,写一个小程序统计两次试验出现的词条及次数,如下:

接下来,继续使用Fiddler在有代理的网络下,每次获取1000次“周关”词条,然后检查左边表格中的词条是否都在这些词条中出现。

在试验到3000次时,左边表格,即未使用代理网络时获取的“周关”词条,都通过代理网络获取到了,说明这些词条的出现跟访问ip没有关系。

欢迎大家于文末留言,

分享你的宝贵见解、

疑问、补充~

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20171215A0PSDU00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

关注

腾讯云开发者公众号
10元无门槛代金券
洞察腾讯核心技术
剖析业界实践案例
腾讯云开发者公众号二维码

扫码关注腾讯云开发者

领取腾讯云代金券