首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >BeautifulSoup冻结

BeautifulSoup冻结
EN

Stack Overflow用户
提问于 2013-07-20 06:39:07
回答 2查看 559关注 0票数 1

我在使用BeautifulSoup时发现,即使代码或连接没有任何变化,解析一个页面有时也要花费相当长的时间。有什么想法吗?

代码语言:javascript
运行
复制
from bs4 import BeautifulSoup   
from urllib2 import urlopen               
#The particular state website:
site = "http://sfbay.craigslist.org/rea/"
html = urlopen(site)                     
print "Done"
soup = BeautifulSoup(html)                
print "Done"

#Get first 100 list of postings:
postings = soup('p')   
EN

回答 2

Stack Overflow用户

发布于 2015-11-05 05:03:49

如果出于某种原因,您想要阅读<a>标记中的文本,可以这样做。

代码语言:javascript
运行
复制
postings = [x.text for x in soup.find("div", {"class":"content"}).findAll("a", {"class":"hdrlnk"})]
print(str(postings).encode('utf-8'))

这将返回一个长度为100的列表。

票数 0
EN

Stack Overflow用户

发布于 2017-02-08 16:39:52

代码语言:javascript
运行
复制
postings = soup('p')  

这段代码不太好。计算机必须检查每一行以确保p标签在其中。一个接一个。

代码语言:javascript
运行
复制
aTag = soup.findAll('a',class_='result_title hdrlnk')
for link in aTag:
    print(link.text)
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/17756582

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档