专栏首页Python与爬虫抓取手机app的数据(摩拜单车)

抓取手机app的数据(摩拜单车)

前几天有人私信我,问能不能帮忙抓取摩拜单车的数据。。。

我想着授人以鱼不如授人以渔,所以本次我们就讲讲如何抓取手机app的内容吧

 Fiddle的安装及配置

抓手机包我用的是fiddle。

安装

  • 先在下载页面下载-→https://www.telerik.com/download/fiddler
  • 选择你“准备用fiddle来干嘛”
  • 你的邮箱
  • 以及同意“最终用户许可协议”就可以下载了

下载后按照提示安装就可以了。

 配置

  • 点击tool->telerik fiddler options…
  • 点击connections,然后勾选 “allow remote computers to connect”,记住这边的端口号(8888)

开始抓包

  • 首先确保电脑和手机连在同一个WiFi下面
  • 打开fiddle
  • 获取电脑ip
    • 打开cmd命令行
    • 输入ipconfig,如图所示,192.168.31.146就是我的ip地址
  • 打开手机WiFi设置,找到你当前链接的WiFi
    • 我当前链接的是Xiaomi_E172_5G
  • 设置代理服务器为你电脑的ip,端口号为上面设置的端口号(默认为8888)
  • 安装https证书
    • 在手机浏览器上打开 你电脑ip:你设置的端口号
    • 我的是192.168.31.146:8888
    • 点击框框处安装证书
  • 设置fiddle监听所有请求
    • 选择all process
  • 打开摩拜单车app
    • 然后你会看到定位的时候一辆车也没有。。。
    • 打开个人详情页还提示“抱歉,服务暂不可用。。。“
    • 这是因为摩拜有防抓取限制(我猜是检测,如果有使用代理的话,直接让你用不了。。。)
    • 那这样的话我们就没办法抓到么???
    • 因为我之前还用过摩拜的小程序,所以我们抓抓微信小程序试试看
    • 打开摩拜单车的小程序
    • 我们看到已经定位了。。,并且把附件的单车都显示出来了
    • 我们可以多移动我们的位置,然后等有把附近的车显示出来
    • 可以看到fiddle上面已经有好多请求了
    • 那么如何找到摩拜的那一条呢。。。
    • 很简单,看单词就好。。。
    • mobike-api。。。这很明显就是我们要找的请求
    • 请求头如下图所示,方法是post
    • 参数如下图
    • 返回值因为我看到是json的格式了,所以直接以json的格式看。
    • 那么直接模拟发送吧 直接看代码吧。。。
  1. import requests
  2. # 如果headers里面没有referer则会访问异常
  3. # referer表示上一个页面是什么。
  4. headers = {
  5. 'User-Agent': 'Mozilla/5.0 (iPhone; CPU iPhone OS 10_3_1 like Mac OS X) AppleWebKit/603.1.30 (KHTML, like Gecko) Mobile/14E304 MicroMessenger/6.5.7 NetType/WIFI Language/zh_CN',
  6. 'Content-Type': 'application/x-www-form-urlencoded',
  7. 'Referer': 'https://servicewechat.com/wx80f809371ae33eda/23/page-frame.html',
  8. }
  9. url = 'https://mwx.mobike.com/mobike-api/rent/nearbyBikesInfo.do'
  10. data = {
  11. 'longitude':'121.1883',# 经度
  12. 'latitude':'31.05147', # 纬度
  13. 'citycode':'021',
  14. 'errMsg':'getMapCenterLocation:ok'
  15. }
  16. # 下面必须加上verify=False,表示不验证ssl,要不然一直报错。。。
  17. z = requests.post(url,data=data,headers=headers,verify=False)

可以看到我们已经抓取了需要的数据,那么怎么抓取整个上海的摩拜单车情况呢?? 只要获取上海的所有经纬度,然后替换上面data中的经度及纬度就可以了。。。

那么怎么获取上海的所有经纬度。。。

我发现挺难的。。。(有人拿到了请告诉我一声,谢谢)

然后我用了高德地图api的搜索功能,搜索了上海的所有小区的经纬度。一共898个,

然后查了这898个小区附件的摩拜单车情况….

总结

看完本编文章,你应该学会“如何抓取手机app的包”

其实挺简单的(就是你手机通过电脑上网,然后这台电脑上所有的请求都被抓下来了,那么你手机的请求自然也被抓下来了)

大家还可以试着抓抓知乎客户端的包。。。

更多fiddle的使用技巧,请善用百度、Google

最后所有代码在https://github.com/kimg1234/pachong/blob/master/mobai.py

本文分享自微信公众号 - Python爬虫分享(python_crawler),作者:爬虫

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2017-06-25

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 爬虫入门到精通-HTTP协议的讲解

    什么是HTTP协议? 引用自维基百科 超文本传输协议(英文:HyperText Transfer Protocol,缩写:HTTP)是互联网上应用最为广泛的一...

    爬虫
  • 每天送0.2美金的小羊毛

    原文在:https://github.com/kusamanetwork/faucet/blob/master/README.md

    爬虫
  • 每周分享第1期

    这里记录过去一周,我看到的值得分享的东西,以及我的一些奇思妙想,每周五发布。灵感来自阮一峰

    爬虫
  • ubuntu完善环境满足zendframework开发

    1.安装环境 http://www.0377joyous.com/archives/87.html 2.完善环境 开启rewrite a2enmod r...

    苦咖啡
  • 低版本中mysql不支持在limit语句中有子查询

    select * from  exec_activity_effect_day oe where oe.ACTIVITY_ID  in   (select  D...

    汤高
  • Centos6X安装python3.6

    yum install openssl-devel bzip2-devel expat-devel gdbm-devel readline-devel sqli...

    py3study
  • Jeff Dean谈2020ML:专用芯片、多模态多任务学习,社区不用痴迷SOTA

    这一次的 NeurIPS 大会,Jeff Dean 很忙。他谈了机器学习领域的很多话题,包括谈论机器学习如何应对气候变化,以及机器学习如何重塑系统和半导体等人们...

    机器之心
  • Shell整数运算

    从上面的运算结果可以看出,默认情况下,Shell 不会直接进行算术运算,而是把+两边的数据(数值或者变量)当做字符串,把+当做字符串连接符,最终的结果是把两个字...

    入门笔记
  • 网络安全最佳实践

    DDoS攻击和Web网络攻击是网络攻击的核心,这里整理出源站(实际运行业务的站点)在IDC和在云上的最佳方案,供用户参考。

    缪应厅
  • Python的闭包

    ZONGLYN

扫码关注云+社区

领取腾讯云代金券