分析思路
分析查询结果页
在拉勾网搜索框中搜索’python’关键字, 在浏览器地址栏可以看到搜索结果页的url为: ‘https://www.lagou.com/jobs/list_python?...查看其它搜索结果的详情url, 发现其格式都为: href=”https://www.lagou.com/jobs/{某个id}.html?...show={show_id}” rel=”external nofollow”
对于第一个ID, 每条结果的id都不一样, 猜想其为标记每个职位的唯一id, 对于show_id, 每条结果的id都是一样的...分析上面ajax的response, 查看其中是否有我们想要的职位ID, 在preview中搜索之前在elements中找到的某个职位的url的两个ID, 确实两个ID都存在response中, 分析发现第一个...的cookie才行, 因为我们这里使用的是scrapy框架, 该框架是能够自带上次请求的cookie来访问下一个请求的, 所以我们这里不需要手动去添加cookie信息, 只需要首先访问一下查询结果页就可以了