前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >python urllib的基本使用之urlopen()

python urllib的基本使用之urlopen()

作者头像
灯珑LoGin
发布2022-10-31 11:27:22
3290
发布2022-10-31 11:27:22
举报
文章被收录于专栏:龙进的专栏

urllib.request模块提供了最基本的构造HTTP请求的方法,利用它可以模拟浏览器的一个请求发起过程,同时还带有处理授权验证、重定向、浏览器Cookies等内容。

举个例子,把python官网抓下来:

代码语言:javascript
复制
import urllib.request

response = urllib.request.urlopen('https://www.python.org')
print(response.read().decode('utf-8'))

然后后就会在控制台看到输出的html文件的信息。

然后我们输出response的对象类型

代码语言:javascript
复制
print(type(response))

然后可以看到它是一个HTTPResponse对象

它主要包含

read(), readinto(), getheader(name), getheaders(), fileno()等方法

以及msg, version, reason, debuglevel, closed等属性

查看返回状态码

代码语言:javascript
复制
print(response.status)

输出 200, 表明请求成功。

查看请求头

代码语言:javascript
复制
import urllib.request

response = urllib.request.urlopen('https://www.python.org')
print(response.getheaders())

然后就会以元组列表的形式返回header中的值

代码语言:javascript
复制
[('Connection', 'close'), ('Content-Length', '49625'), ('Server', 'nginx'), ('Content-Type', 'text/html; charset=utf-8'), ('X-Frame-Options', 'DENY'), ('Via', '1.1 vegur, 1.1 varnish, 1.1 varnish'), ('Accept-Ranges', 'bytes'), ('Date', 'Fri, 27 Nov 2020 14:46:37 GMT'), ('Age', '358'), ('X-Served-By', 'cache-bwi5139-BWI, cache-tyo19946-TYO'), ('X-Cache', 'HIT, HIT'), ('X-Cache-Hits', '4, 250'), ('X-Timer', 'S1606488397.399488,VS0,VE0'), ('Vary', 'Cookie'), ('Strict-Transport-Security', 'max-age=63072000; includeSubDomains')]

如果只是想获得某一属性的返回值,比如获得server属性,那么就这样写

代码语言:javascript
复制
print(response.getheader('Server'))

返回的是 nginx, 说明服务器用的是nginx

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2020年12月2日2,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档