前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >一日神技:最快30秒写出一个异步加载爬虫

一日神技:最快30秒写出一个异步加载爬虫

作者头像
青南
发布2019-07-23 10:11:18
5330
发布2019-07-23 10:11:18
举报
文章被收录于专栏:未闻Code

在开发爬虫的过程中,遇到异步加载的接口,我们一般会使用如下几步来使用Python获取接口里面的内容:

  • 在Chrome中通过开发者工具找到接口,如下图所示
  • 把URL复制出来
  • 把字符串形式的Headers复制出来:
  • 把Headers改造成字典的形式
代码语言:javascript
复制
headers = {
    'Accept': '*/*',
    'Accept-Encoding': 'gzip, deflate',
    'Accept-Language': 'zh-CN,zh;q=0.9,en;q=0.8',
    'Connection': 'keep-alive',
    'Content-Type': 'application/json; charset=UTF-8',
    'Cookie': '__cfduid=d82848eba37c2cbe78ba309bcdd18aa381560756114; v=AqRSJ14kpQxCvtFA70tAOEAnc6mXPcinimFc677FMG8yaUrb5k2YN9pxLHoN; _xsrf=2|c8685b58|ae9e0011924ca21d94653488771dc217|1563418855',
    'DNT': 1,
    'Host': 'exercise.kingname.info',
    'Origin': 'http://exercise.kingname.info',
    'Referer': 'http://exercise.kingname.info/exercise_ajax_3.html',
    'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_5) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Safari/537.36',
    'X-Requested-With': 'XMLHttpRequest'}
  • 如果是POST接口,还需要复制Body:
  • ……

整个过程冗长、机械又枯燥。那有没有办法在30秒内完成这所有的操作呢?

请看下面这个动图:

实现步骤如下:

  • 在Chrome开发者工具中找到异步加载的接口
  • 右键这个请求,选择 Copy- CopyascURL,如下图所示:
  • 打开Postman,点击右上角 Import按钮:
  • 在弹出窗口中定位到 PasteRawText,并粘贴,如下图所示:
  • 粘贴完成,点击 Import按钮。回到Postman主界面,点击右上角的 Code按钮,如下图所示:
  • 在弹出窗口中,左上角选择 PythonRequests,最后点击右上角的 CopytoClipboard
  • 到PyCharm或者其他编辑器中粘贴代码,运行!

以上就是全部过程,速度快的话,不到30秒就能完成。让你把更多精力放在真正有用的地方,而不是这些机械繁杂的操作。

提示

这种方式粘贴下来的代码,虽然可以正常工作,但是有时候还是需要你做一些修改,才能更好地使用。

例如它发起请求使用的是 requests.request('POST',...)这种写法,但是你实际项目中可能需要使用 requests.post(...)或者 session.post(...)

这些自动生成的代码使用的是 print(response.text),有时候你可能需要改成 response.json()或者 response.content.decode('utf-8')

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-07-18,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 未闻Code 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 提示
相关产品与服务
云开发 CLI 工具
云开发 CLI 工具(Cloudbase CLI Devtools,CCLID)是云开发官方指定的 CLI 工具,可以帮助开发者快速构建 Serverless 应用。CLI 工具提供能力包括文件储存的管理、云函数的部署、模板项目的创建、HTTP Service、静态网站托管等,您可以专注于编码,无需在平台中切换各类配置。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档