前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >python-urlparse

python-urlparse

作者头像
py3study
发布2020-01-13 12:48:33
5140
发布2020-01-13 12:48:33
举报
文章被收录于专栏:python3

http://docs.python.org/2/library/urlparse.html?highlight=urlparse#urlparse

主要函数如下:

1。urlparse

代码语言:javascript
复制
#!/usr/bin/python import urlparse webURL = "http://www.google.com/search?hl=en&q=python&btnG=Google+Search" #parseTuple = urlparse.urlsplit(webURL) parseTuple = urlparse.urlparse(webURL) print parseTuple 

输出如下:

代码语言:javascript
复制
ParseResult(scheme='http', netloc='www.google.com', path='/search', params='', query='hl=en&q=python&btnG=Google+Search', fragment='') 

我们可以看到输入为6个部分;元组 (scheme, netloc, path, parameters, query, fragment)

2. urlparse.urlunparse(parts)

代码语言:javascript
复制
#!/usr/bin/python import urlparse URLschema = "ftp" webURL = "http://www.google.com/search?hl=en&q=python&btnG=Google+Search" #parseTuple = urlparse.urlsplit(webURL) parseTuple = urlparse.urlparse(webURL) print parseTuple u = urlparse.urlunparse((URLschema,parseTuple.netloc,parseTuple.path,parseTuple.params,parseTuple.query,'')) print u 

结果如下:

重新拼合成了一个新的url

代码语言:javascript
复制
ParseResult(scheme='http', netloc='www.google.com', path='/search', params='', query='hl=en&q=python&btnG=Google+Search', fragment='') ftp://www.google.com/search?hl=en&q=python&btnG=Google+Search 

3.

urlparse.urlsplit(urlstring[, scheme[, allow_fragments]]) This function returns a 5-tuple: (addressing scheme, network location, path, query, fragment identifier).

代码语言:javascript
复制
SplitResult(scheme='http', netloc='www.google.com', path='/search', query='hl=en&q=python&btnG=Google+Search', fragment='') 

4.urlparse.urljoin(base, url[, allow_fragments])

这个的主要作用是拼接url

代码语言:javascript
复制
import urlparse #-*- coding:utf-8 -*- #测试1 base_url = "http://motor.blog.51cto.com/blog/addblog.php" relative_url = "../blog/test.php" abs_url = urlparse.urljoin(base_url, relative_url) print abs_url #测试2 base_url_2 = "http://motor.blog.51cto.com/blog/addblog.php" relative_url_2 = "test.php" abs_url_2 = urlparse.urljoin(base_url_2, relative_url_2) print abs_url_2 #测试3 base_url_3 = "http://motor.blog.51cto.com/blog/" relative_url_3 = "test.php" abs_url_3 = urlparse.urljoin(base_url_3, relative_url_3) print abs_url_3 #测试4 base_url_4 = "http://motor.blog.51cto.com/blog" relative_url_4 = "test.php" abs_url_4 = urlparse.urljoin(base_url_4, relative_url_4) print abs_url_4 

结果如下:

代码语言:javascript
复制
http://motor.blog.51cto.com/blog/test.php http://motor.blog.51cto.com/blog/test.php http://motor.blog.51cto.com/blog/test.php http://motor.blog.51cto.com/test.php 
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2019/08/07 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档