如何使用Python检索网页的页面标题(title html标签)?
发布于 2008-09-09 04:49:38
我总是使用lxml来完成这类任务。您也可以使用beautifulsoup。
import lxml.html
t = lxml.html.parse(url)
print(t.find(".//title").text)
基于注释进行编辑:
from urllib2 import urlopen
from lxml.html import parse
url = "https://www.google.com"
page = urlopen(url)
p = parse(page)
print(p.find(".//title").text)
发布于 2017-01-31 20:46:48
无需导入其他库。Request内置了此功能。
>> hearders = {'headers':'Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:51.0) Gecko/20100101 Firefox/51.0'}
>>> n = requests.get('http://www.imdb.com/title/tt0108778/', headers=hearders)
>>> al = n.text
>>> al[al.find('<title>') + 7 : al.find('</title>')]
u'Friends (TV Series 1994\u20132004) - IMDb'
发布于 2008-09-09 05:45:39
机械化浏览器对象有一个title()方法。因此,this post中的代码可以重写为:
from mechanize import Browser
br = Browser()
br.open("http://www.google.com/")
print br.title()
https://stackoverflow.com/questions/51233
复制相似问题