# Intro
对于使用JS动态加载, 或者将下一页地址隐藏为 JavaScriptvoid(0)的网站, 如何爬取我们要的信息呢本文以 Chrome浏览器为工具, 36Kr为示例网站, 使用 Json...JSON是一种与XML在格式上很像, 但是占用空间更小的数据交换格式, 全程是 JavaScript Object Notation, 本文中的36Kr动态加载时获取到的信息就是JSON类型的数据....网站为了节省空间, 加快响应, 常常没有对 JSON 进行格式化, 导致 JSON 的可读性差, 难以寻找我们要的信息....我们通过右键打开获取到的 XHR 请求, 然后看看数据是怎样的
使用 Json Handle 后的数据可读性就很高了
Step 3...., 但 b_id又是网站设定的规则, 无从入手
改了 no_bid为 true似乎没有变化, 接着修改了 column_id为70, 发现新闻的内容发生改变, 合理猜测这个应该是新闻标签的id.