文章/答案/技术大牛

发布

社区首页 >问答首页 >通过web抓取在HTML中找到一个特定的标记

问通过web抓取在HTML中找到一个特定的标记
EN

Stack Overflow用户

提问于 2022-10-20 23:58:23

回答 1查看 39关注 0票数 -1

我正在使用for循环在不同的html页面上进行web抓取，我需要为每个页面找到一个特定的标记(我使用的是BeautifulSoup和find_all方法)。但并不是在所有标签存在的页面中。所以我需要找到一种简单的方法来检查标签是否存在。为了检查标签是否不存在，我尝试编写了这段代码，但是它不工作。

    ---------------------------------------------------------------------------
AttributeError                            Traceback (most recent call last)
Input In [92], in <cell line: 5>()
     36 sal_play = salary.find_all('tr')[1:]
     37 print(sal_play)
---> 38 if sal_play.find_all('tr', class_='thead') is None :
     39     print('1')
     40 else:

AttributeError: 'list' object has no attribute 'find'

html

beautifulsoup

python

回答 1

Stack Overflow用户

发布于 2022-10-29 19:50:07

正如错误消息所指出的，不能直接在列表上运行find --必须在每个项上运行它

如果您只想在没有标题行的情况下打印“1”，请使用：

if not [s for s in sal_play if s.find('tr', class_='thead')]: 
    print('1')

或者，如果您想打印“1”，只要其中一些没有标题行，请使用：

if [s for s in sal_play if s.find('tr', class_='thead') is None]: 
    print('1')

顺便说一句，如果标签不存在，find_all将返回一个空列表([])，find将返回None，因此if ...find_all(....) is None: do x将几乎确保x永远不会发生.

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/74147426

复制

相似问题

问通过web抓取在HTML中找到一个特定的标记
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问通过web抓取在HTML中找到一个特定的标记EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问通过web抓取在HTML中找到一个特定的标记
EN