# Intro
对于使用JS动态加载, 或者将下一页地址隐藏为 JavaScriptvoid(0)的网站, 如何爬取我们要的信息呢本文以 Chrome浏览器为工具, 36Kr为示例网站, 使用 Json...Handle 作为辅助信息解析工具, 演示如何抓取此类网站.
# Detail
Step 1....选中Network一栏, 筛选 XHR请求
XHR 即 XMLHttpRequest, 可以异步或同步返回服务器响应的请求, 并且能够以文本或者一个 DOM 文档的形式返回内容....我们通过右键打开获取到的 XHR 请求, 然后看看数据是怎样的
使用 Json Handle 后的数据可读性就很高了
Step 3....换算下来, 就是最多允许爬 15 页
滑动了超过15页发现仍然有信息显示, 经过转换, 发现它的时间戳只是浏览网页生成的时间戳, 与内容无关
按了几个数字, 修改了 b_id的值, 发现内容确实发生了改变