我在这里尝试做的是获取给定URL的头部,这样我就可以确定MIME类型。例如,我希望能够看到http://somedomain/foo/
是否会返回一个超文本标记语言文档或JPEG图像。因此,我需要弄清楚如何发送HEAD请求,这样我就可以读取MIME类型,而不必下载内容。有没有人知道一种简单的方法?
发布于 2010-01-15 18:50:53
urllib2可用于执行HEAD请求。这比使用httplib要好一点,因为urllib2会为您解析URL,而不是要求您将URL拆分为主机名和路径。
>>> import urllib2
>>> class HeadRequest(urllib2.Request):
... def get_method(self):
... return "HEAD"
...
>>> response = urllib2.urlopen(HeadRequest("http://google.com/index.html"))
头文件可以像以前一样通过response.info()获得。有趣的是,您可以找到被重定向到的URL:
>>> print response.geturl()
http://www.google.com.au/index.html
发布于 2012-10-21 19:00:50
强制Requests
方式:
import requests
resp = requests.head("http://www.google.com")
print resp.status_code, resp.text, resp.headers
发布于 2011-09-12 20:02:47
我认为Requests库也应该被提及。
https://stackoverflow.com/questions/107405
复制相似问题