首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >使用urllib

使用urllib

作者头像
py3study
发布2020-01-19 11:15:50
4000
发布2020-01-19 11:15:50
举报
文章被收录于专栏:python3python3

urlopen的基本用法:

工具为:python3(windows)

其完整表达式为:

urllib.request.urlopen(url, data=None, [timeout, ]*, cafile=None, capath=None, cadefault=False, context=None)

1、发出一个请求.打开bttpbin.org网页,此处为get方式的请求类型

>>>import urllib.request  >>> response = urllib.request.urlopen("http://httpbin.org")

#此处为将 结果赋值给response >>> print(response.read().decode('utf-8'))

#得到的response是bytes类型,所以我们需要使用decode

httpbin.org:可以以后用来做http测试

2、此处为POST 类型的请求需要使用到data

>>> import urllib.parse >>> import urllib.request >>> data = bytes(urllib.parse.urlencode({"word":"hello"}),encoding="utf8")

#需要创建data参数,需要为bytes类型,用urlencode将字典传过去 >>> response = urllib.request.urlopen("http://httpbin.org/post",data = data) >>> print(response.read())

3、超时设置timeout

>>> import urllib.request >>> response = urllib.request.urlopen("http://httpbin.org/get",timeout=1 ) >>> print(response.read())

发现下方有正常的响应

 若超时的时间为0.1,如果出现异常,对异常进行捕获

>>> import socket >>> import urllib.request >>> import urllib.error

try: response = urllib.request.urlopen("http://httpbin.org/get",timeout=0.1) except urllib.error.URLError as e: if isinstance(e.reason,socket.timeout): print("TIME OUT")

会出现TIME  OUT 结果。

发送请求之后出现响应

1、响应类型

>>> import urllib.request >>> response = urllib.request.urlopen("http://httpbin.org") >>> print(type(response)) <class 'http.client.HTTPResponse'>

2、状态码 响应头

>>> import urllib.request >>> response =urllib.request.urlopen("http://httpbin.org") >>> print(response.status)   #此处为状态码,200显示为成功的意思 200 >>> print(response.getheaders()) #此处为获取所有的状态头,并且以元组的形式输出 [('Connection', 'close'), ('Server', 'gunicorn/19.9.0'), ('Date', 'Tue, 09 Oct 2018 12:49:34 GMT'), ('Content-Type', 'text/html; charset=utf-8'), ('Content-Length', '10122'), ('Access-Control-Allow-Origin', '*'), ('Access-Control-Allow-Credentials', 'true'), ('Via', '1.1 vegur')]

>>> print(response.getheader('Server')) gunicorn/19.9.0

[此处表示为此处的服务器是由gunicorn/19.9.0所做]
response.read():获取响应体内容为bytes类型,我们可以用decode进行转化

>>> import urllib.request >>> response = urllib.request.urlopen("http://httpbin.org") >>> print(response.read().decode('utf-8'))

Request的基本用法

(如果我们想要发送header对象或者其他复杂东西,就需要用到Request)

>>> import urllib.request >>> response = urllib.request.Request("http://httpbin.org")

>>> response = urllib.request.urlopen(request)

>>> print(response.read().decode('utf-8')) 正常输出,与上方直接输入的结果是完全一致,有了Request能够更加方便

此处为模仿火狐浏览器进行请求

from urllib import request,parse url = "http://httpbin.org/post" headers = { "User-Agent":'Mozllia/4.0(compatible;MSIE 5.5;Windows NT)', "Host":'httpbin.org' } dict = { 'name':'Germey' } data = bytes(parse.urlencode(dict),encoding="utf8") req = request.Request(url=url,data=data,headers=headers,method="POST") response= request.urlopen(req) print(response.read().decode("utf-8"))

也会出现结果
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2019-03-16 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • urlopen的基本用法:
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档