# Intro
对于使用JS动态加载, 或者将下一页地址隐藏为 JavaScriptvoid(0)的网站, 如何爬取我们要的信息呢本文以 Chrome浏览器为工具, 36Kr为示例网站, 使用 Json...JSON是一种与XML在格式上很像, 但是占用空间更小的数据交换格式, 全程是 JavaScript Object Notation, 本文中的36Kr动态加载时获取到的信息就是JSON类型的数据....网站为了节省空间, 加快响应, 常常没有对 JSON 进行格式化, 导致 JSON 的可读性差, 难以寻找我们要的信息....我们通过右键打开获取到的 XHR 请求, 然后看看数据是怎样的
使用 Json Handle 后的数据可读性就很高了
Step 3....至此, 我们已大致了解整个 URL 的含义
per_page 每次滑动可以获得的数据条目, 最大值为300
column_ids 新闻内容标签, 69为资本, 68为B轮后等
b_id 新闻集合的某种id