那么我们就需要找到具体是那个请求会返回搜索结果的信息, 一般这种情况首先考虑是不是通过ajax获取的数据, 筛选类型为XHR(ajax)的请求, 可以逐个点开查看response, 发现 positionAjax.json...说明确实是通过ajax获取的数据, 其实点击下一页, 我们也可以发现地址栏url地址并没有发生变化, 只是局部刷新了搜索结果的数据, 也说明了搜索结果是通过ajax返回的.
?...ID即为positionId, 第二个即为showId, 我们还可以发现response中返回了当前的页码数pageNo
因此我们只需要访问上面ajax对应的url: https://www.lagou.com...即start_url = https://www.lagou.com/jobs/list_python
此外发现这个ajax请求是通过POST方式发送的, 因此还需要分析它提交的form数据, 在第一页中有三条数据信息...cookies, 访问数据结果第一页
yield scrapy.FormRequest(
'https://www.lagou.com/jobs/positionAjax.json?