Python-数据挖掘-requests库
一、发送请求
requests 库中提供了很多发送 HTTP 请求的函数。
构造一个请求,支撑以下各方法的基础方法。
获取 HTML 网页的主要方法,对应于 HTTP 的 GET 请求。
获取 HTML 网页头信息的方法,对应于 HTTP 的 HEAD 请求方法。
向 HTML 网页提交 POST 请求的方法,对应于 HTTP 的 POST 请求方法。
向 HTML 网页提交 PUT 请求的方法,对应于 HTTP 的 PUT 请求方法。
向 HTML 网页提交局部修改请求,对应于 HTTP 的 PATCH 请求方法。
向 HTML 网页提交删除请求,对应于 HTTP 的 DELETE 请求方法。
二、返回响应
Response 类用于动态地响应客户端的请求,控制发送给用户的信息,并且将动态地生成响应,包括状态码、网页的内容等。
Response 类的常用属性:
HTTP 请求的返回状态,200表示连接成功,404表示失败。
HTTP 响应内容的字符串形式,即 URL 对应的页面内容。
从 HTTP 请求中响应内容编码方式。
从内容中分析出的响应编码的方式。
HTTP 响应内容的二进制形式。
Response 类会自动解码来自服务器的内容,并且大多数的 Unicode 字符集都可以被无缝地解码。
当请求发出之后,Requests 库会基于 HTTP 头部信息对响应的编码做出有根据的判断。例如,在使用 response.text(response 为响应对象)时,可以使用判断的文本编码。还可以找出 Requests 库使用了什么编码,并且可以设置 encoding 属性进行改变。
>>> response.encoding'utf-8'>>> response.encoding="ISO-8859-1"
再次调用 text 属性获取返回的文本内容时,将会使用上述设置的新的编码方式。