(状态码由三位数字构成第一位表示状态码类型)
常见状态码 2000K:正常返回信息 301 永久重定向,302 临时重定向 400 Bad Request:客户端请求有语法错误,不能被服务器所理解 401 Unauthorized:请求未经授权,这个状态代码必须和WWW-Authenticate 报头域一起使用 403 Forbidden:服务器收到请求,但是拒绝提供服务eg:比如IP被禁了 404Not Found:请求资源不存在,eg,输入了错误的URL 500Internal Server Error:服务器发生不可预期的错误 503 Server Unavailable:服务器当前不能处理客户端的请求,一段时间后可能恢复正常 521 :爬虫自己遇到的没有携带js执行返回的cookie
从三个层面回答
HTTP本身是无连接的,正常我们每次请求数据都要重新建立携带数据连接(如登录),但是这样相当麻烦,因此我们引入了某些机制让HTTP具备状态,其中两个便是cookie,session.