使用Fiddler抓取bilibili安卓客户端口数据并分析http、https

一、简述

经过了一个多星期的时间(自2017/10/16开始),到目前(2017/10/24)为止,项目框架的搭建已基本完成、还完成了首页中「直播」与「推荐」Fragment的数据填充,可以说相仿度很高,说这么多不如先看看效果。

仿「直播」界面

仿「推荐」界面

很6吧,但这不是重点,本篇要记录的,是使用fiddler来抓取app客户端的数据(包括http和https的数据抓取),并记录下对接口与数据的分析结果,下面就直入主题吧。

二、使用Fiddler抓http包

1、Fiddler设置

要使用Fiddler来给手机app抓包,需要进行一次设置。

通过Tools->Fiddler Options进入设置界面:

切换到Connections标签,填写要监听的端口(如:8888),将下方3个钩勾上,最后点击OK关闭设置界面。

2、手机设置

打开设置,找到WLAN,长按当前连接的wifi,设置代理主机与端口。

  • 要注意,你的手机必须和运行Fiddler的电脑在同个局域网内。
  • 不同的手机设置界面有所不同,这里以模拟器为例,其他手机请参考后自己在对应位置进行设置。

3、开始抓包

经过上面的2步设置后,下面就可以来抓包了。

此时如果在Fiddler中有太多请求记录,不方便我们查看接下来要抓的数据,可以进行如下操作将这些记录清除。

仔细看,当我从「推荐」切换到「直播」时,app发起来数据请求,同时Fiddler中捕获到了12条数据。这其中,只有带有Json图标的记录是我们要的(即序号为3,4,5的数据)。

分别点击这3条json数据请求记录,发现序号5的请求是我们想要的

Fiddler自带的json查看窗口可以很方便的帮我们理清返回的数据结构,但可惜的是,它提供的可操作性实在是太弱了,连复制都不行,所以这个窗口的作用也就是让我们方便的查看下抓取到的数据请求是不是我们想要的而已了。

4、使用HiJson代替Fiddler自带的json查看窗口

很多时候,我都会使用HiJson来帮助我完成对接口返回数据的分析,我相信大多数安卓开发者对该工具应该不会陌生。不过,HiJson不支持直接数据请求,所以需要从别处将json数据复制到HiJson中,Fiddler的WebView窗口可以帮到我们。

初次点击WebView

点击淡黄色提示后的WebView

将WebView窗口中的数据全选,右键,复制。打开HiJson,粘贴到左窗口后点击“格式化JSON字符串”。

好了,http的数据包抓取就到这了,不难,下面来看看https的抓包流程。

三、使用fiddler抓https包

参考上面http的抓包配置,确定配置无误后,开始抓一次「推荐」版块的包看看。

有没有发现什么问题?在Fiddler中没找不到带有Json图标的请求记录,但有2个带锁的请求,而且Host显示"Tunnel To",这就说明「推荐」版块采用的是https请求,这种加密请求,没办法这样直接查看,还需要进行以下配置。

1、Fiddler设置

打开Fiddler设置界面,切换到HTTPS标签,将"Capture HTTPS CONNECTs"、"Decrypt HTTPS traffic"、"Ignore server certificate errors(unsafe)"都勾上,将中间的下拉菜单选择为"from all processes",最后点击OK关闭设置界面。

2、手机设置

打开手机浏览器,输入运行Fiddler的主机ip与监听的端口,可以打开一个Fiddler的证书下载页面。

点击最后一行的"FiddlerRoot certificate"下载并安装证书。

最后,重启Fiddler。

可能在安装证书的时候会要求你为手机设置锁屏密码,随便设置一个你能记住的密码就好了,如Pin码:1234。

3、开始抓包

经过上面的配置后,下面就可以来抓https的包了。

重复之前的操作,在「推荐」版块中刷新一下看看(留意下Protocol列)。

这次抓取到了2条https记录,一眼就看出来了,序号1那条就是我们想要的(带着json图标)。

下面我们来验证下,这是不是就是刷新时服务器返回的json数据呢?

没错,就是服务器返回的json数据。

要注意,现在的多数app都会有数据缓存功能,如果你在使用Fiddler抓包的过程中遇到app在启动加载数据时,捕获不到你想要看到的数据请求记录,那很有可能就是app使用了之前的数据缓存,你要做的就是到系统的设置中,找到应用管理列表中对应的app,然后手动清空app的缓存数据即可。

到这里,使用Fiddler抓取app的http、https数据包的过程及注意事项就都说完了。接下来就记录下我对bilibili首页的「推荐」版块数据的分析吧。

四、接口与数据分析

1、接口

对比了几个不同时机的接口数据(开启app时,下拉刷新时,上拉加载更多时),我发现!!!

url中的几个关键参数作用分别如下:

  • idx:第一次加载数据时为0(此时,open_event=cold),若是加载更多,则是之前数据中的最后一个idx,或是刷新,则是之前数据中一开始的idx。
  • pull:刷新为true,加载更多为false。
  • login_event:为1时会加载banner,为0时则不加载banner(细节有待考究)
  • 其他参数,亲测不用也无所谓~

2、数据

这部分图片过多,可能看官大爷没什么耐心看,文章的最后有附上该界面的实现代码链接,可直接拉到最后查看。

通过仔细观查的bilibili手机APP的界面设计,并分析对应返回的数据的结构,我又发现!!!

安卓开发者一眼就能看出来,这个「推荐」版块绝对是采用多布局列表设计,那这个列表到底有多少布局呢,答案是至少有12种(根据数据的goto字段区分)。就我找出的这12种布局大致可分为2大类:「大布局」和「小布局」。

1)「大布局」

大布局包括的goto值有:banner、coverge、special、topic、rank、tag。

goto = banner

goto = coverge

goto = special

goto = topic

goto = rank

goto = tag

2)「小布局」

小布局包括的goto值有:av、av(带有rcmd_reason)、bangumi、login、ad_web_s、article_s。

goto = av

goto = av(带有rcmd\_reason)

goto = ad

goto = articl

goto = bangumi

goto = login

原文发布于微信公众号 - Android机动车(JsAndroidClub)

原文发表时间:2017-10-28

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏weixuqin 的专栏

sublime下让代码居中

39313
来自专栏PHP技术大全

使用PHP辅助快速制作一套自己的手写字体实践

笔者以前在网上看到有民间高手制作字体的相关事迹,觉得把自己的手写字用键盘敲出来是一件很有意思的事情,所以一直有时间想制作一套自己的手写体,前几天在网上搜索了一下...

1783
来自专栏腾讯社交用户体验设计

vuejs初体验-Chrome插件开发实录

3362
来自专栏腾讯NEXT学位

小程序初学者必读——小程序的简单入门

2363
来自专栏Bug生活2048

微信小程序版博客——图片相关处理

前面提到,小程序服务端的数据是基于Ghost的公共API的,在设计首页文章列表时,为了美观加上了头图,但是服务端没有提供对应的字段(头图url)。

3722
来自专栏企鹅号快讯

小程序开发的40个技术窍门,纯干货!

微信小程序正式上线一周时间,相关话题持续升温。现在为大家筛选出小程序开发实战需要注意的40个技术点,供大家参考! ? 小程序开发的40个技术窍门 1 Q:为什么...

26310
来自专栏菩提树下的杨过

asp.net webform中submit按钮使用不当很容易犯的一个错误

webform中默认一个页面只能有一个form,有时submit按钮使用不当会产生一些奇怪的问题。 ? 比如这是一个网站的头部搜索部分,前端人员把“搜索”按钮用...

2185
来自专栏Petrichor的专栏

ubuntu: 修改 默认编辑器

因为觉得 gedit 太简陋, vim 、vi 、nano 又没有UI那么直观,所以安装了Atom编辑器。但是每次还是默认从 gedir 打开文本,所以我需要 ...

5863
来自专栏林德熙的博客

win10 uwp 读写csv 使用库 Chilkat

CSV是一种通用的、相对简单的文件格式,被用户、商业和科学广泛应用。最广泛的应用是在程序之间转移表格数据,而这些程序本身是在不兼容的格式上进行操作的(往往是私有...

1451
来自专栏Python中文社区

运用Python实现WordPress网站大规模自动化发布文章

很多用WordPress建站的朋友都有这样的苦恼,网站建好了,没有时间自己写文章,慢慢就荒废了,还有的朋友在浏览器收集好多喜欢的博客网站地址,因为收集的网址太多...

7538

扫码关注云+社区

领取腾讯云代金券