文章/答案/技术大牛

发布

问BeautifulSoup冻结
EN

Stack Overflow用户

提问于 2013-07-20 06:39:07

回答 2查看 559关注 0票数 1

我在使用BeautifulSoup时发现，即使代码或连接没有任何变化，解析一个页面有时也要花费相当长的时间。有什么想法吗？

from bs4 import BeautifulSoup   
from urllib2 import urlopen               
#The particular state website:
site = "http://sfbay.craigslist.org/rea/"
html = urlopen(site)                     
print "Done"
soup = BeautifulSoup(html)                
print "Done"

#Get first 100 list of postings:
postings = soup('p')

beautifulsoup

python

回答 2

Stack Overflow用户

发布于 2015-11-05 05:03:49

如果出于某种原因，您想要阅读<a>标记中的文本，可以这样做。

postings = [x.text for x in soup.find("div", {"class":"content"}).findAll("a", {"class":"hdrlnk"})]
print(str(postings).encode('utf-8'))

这将返回一个长度为100的列表。

票数 0

Stack Overflow用户

发布于 2017-02-08 16:39:52

postings = soup('p')

这段代码不太好。计算机必须检查每一行以确保p标签在其中。一个接一个。

aTag = soup.findAll('a',class_='result_title hdrlnk')
for link in aTag:
    print(link.text)

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/17756582

复制

相似问题

问BeautifulSoup冻结
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问BeautifulSoup冻结EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问BeautifulSoup冻结
EN