# Intro
对于使用JS动态加载, 或者将下一页地址隐藏为 JavaScriptvoid(0)的网站, 如何爬取我们要的信息呢本文以 Chrome浏览器为工具, 36Kr为示例网站, 使用 Json...Handle 作为辅助信息解析工具, 演示如何抓取此类网站.
# Detail
Step 1....选中Network一栏, 筛选 XHR请求
XHR 即 XMLHttpRequest, 可以异步或同步返回服务器响应的请求, 并且能够以文本或者一个 DOM 文档的形式返回内容....网站为了节省空间, 加快响应, 常常没有对 JSON 进行格式化, 导致 JSON 的可读性差, 难以寻找我们要的信息...., 但 b_id又是网站设定的规则, 无从入手
改了 no_bid为 true似乎没有变化, 接着修改了 column_id为70, 发现新闻的内容发生改变, 合理猜测这个应该是新闻标签的id.