开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

BeautifulSoup4:当页面上没有项目时，如何让find_all()返回"N/A“(Python3.6)

BeautifulSoup4是一个用于解析HTML和XML文档的Python库。它提供了一种简单而灵活的方式来遍历、搜索和修改文档树。

在使用BeautifulSoup4的find_all()方法时，如果页面上没有匹配的项目，可以通过设置参数来让它返回"N/A"。具体做法是使用try-except语句来捕获异常，并在异常处理块中返回"N/A"。

以下是一个示例代码：

from bs4 import BeautifulSoup

# 假设html是你要解析的HTML文档
html = """
<html>
<body>
<div class="item">Item 1</div>
<div class="item">Item 2</div>
</body>
</html>
"""

try:
    soup = BeautifulSoup(html, 'html.parser')
    items = soup.find_all('div', class_='item')
    if len(items) == 0:
        raise Exception('No items found')
    else:
        for item in items:
            print(item.text)
except Exception as e:
    print('N/A')

在上述代码中，我们首先使用BeautifulSoup将HTML文档解析成一个BeautifulSoup对象。然后使用find_all()方法查找所有class为"item"的div元素。如果找到了匹配的项目，则打印每个项目的文本内容；如果没有找到匹配的项目，则抛出一个自定义的异常。在异常处理块中，我们打印"N/A"。

这样，当页面上没有项目时，find_all()方法会返回"N/A"。

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

干了这碗“美丽汤”，网页解析倍儿爽

接下来介绍点 bs 的基本方法，让你看完就能用起来。...或其他方法检测信息->输出或保存可以迭代式的查找，比如先定位出一段内容，再其上继续检索开发时应注意不同方法的返回类型，出错时多看报错、多加输出信息官方文档很友好，也有中文，推荐阅读安装推荐使用...pip进行安装（关于 pip 见前文《如何安装 Python 的第三方模块》）： pip install beautifulsoup4 要注意，包名是beautifulsoup4，如果不加上 4，会是老版本也就是...如果有多个满足的结果，find只返回第一个；如果没有，返回 None。...find_all 返回的是一个由 bs4.element.Tag 对象组成的 list，不管找到几个或是没找到，都是 list。

1.3K2 0

干了这碗“美丽汤”，网页解析倍儿爽

不过在以往的文章中，大多是关注在如何把网页上的内容抓取下来。今天我们来分享下，当你已经把内容爬下来之后，如何提取出其中你需要的具体信息。...接下来介绍点 bs 的基本方法，让你看完就能用起来。...或其他方法检测信息->输出或保存可以迭代式的查找，比如先定位出一段内容，再其上继续检索开发时应注意不同方法的返回类型，出错时多看报错、多加输出信息官方文档很友好，也有中文，推荐阅读安装推荐使用...如果有多个满足的结果，find只返回第一个；如果没有，返回 None。...find_all 返回的是一个由 bs4.element.Tag 对象组成的 list，不管找到几个或是没找到，都是 list。

9642 0

你说：公主请学点爬虫吧！

如何在茫茫数字的海洋中找到自己所需的数据呢？不妨试试爬虫吧！本文，我们从最基本的 python 爬虫入门。谈谈小白如何入门！...print(x.text) beautifulsoup4 和前者一样，利用beautifulsoup4库也能很好的解析 html 中的内容。...soup = BeautifulSoup(page.text, 'html.parser') 接下来，利用find_all() 方法将返回由 quote 类标识的所有 HTML 元素的列表。...BeautifulSoup(page.text, 'html.parser') # 初始化一个包含了所有抓取的数据列表的变量 quotes = [] scrape_page(soup, quotes) # 抓取下一页内容...对大型爬虫项目，数据的后期处理比较麻烦在此，表哥为大家推荐一款数据处理和爬虫很牛叉的平台Bright Data 我们到官网首先注册，官网地址：https://get.brightdata.com/wxdtkgpzhtj8

3133 0

Python爬虫-BeautifulSoup详解

首先网页解析有很多种解析工具，包括之前的正则表达式也可以用来解析（正则表达式如何使用），这节我们介绍通过BeautifulSoup4 进行网页解析。...官方链接奉上，https://beautifulsoup.readthedocs.io/zh_CN/latest/ 安装BeautifulSoup4 启动cmd 输入pip3 install beautifulsoup4...：搜索所有子节点，返回列表 find_all(name, attrs, recursive, text, limit, **kwargs)：搜索当前tag的所有tag子节点,并判断是否符合过滤器的条件...：搜索所有子节点，返回结果 find_all 返回所有子节点，且返回列表 find 只返回搜索到的第一个子节点（3）find_parent：搜索父节点 find_parent 搜索当前节点的父节点...Python系列 Python系列会持续更新，从基础入门到进阶技巧，从编程语法到项目实战。若您在阅读的过程中发现文章存在错误，烦请指正，非常感谢；若您在阅读的过程中能有所收获，欢迎一起分享交流。

1.5K3 0

python爬虫（三）数据解析，使用bs4工具

select方法： 9 案例1 1 BeautifulSoup4介绍和 lxml 一样，Beautiful Soup 也是一个HTML/XML的解析器，主要的功能也是如何解析和提取 HTML/XML...Beautiful Soup 3 目前已经停止开发，推荐现在的项目使用Beautiful Soup 4。 2 安装和文档： 1. 安装：`pip install bs4`。 2....' # u'\n\n' # u'......8 搜索文档树 8.1 find和find_all方法：搜索文档树，一般用得比较多的就是两个方法，一个是find，一个是find_all。...find方法是找到第一个满足条件的标签后就立即返回，只返回一个元素。find_all方法是把所有满足条件的标签都选到，然后返回回去。

8721 0

如何用 Python 爬取天气预报

库 https://www.crummy.com/software/BeautifulSoup/bs4/doc/ 没有Python基础的新人，我建议可以学习以下资料： 1、官方最新的英文文档（https...首先我们做爬虫，拿到手第一个步骤都是要先获取到网站的当前页的所有内容，即HTML标签。所以我们先要写一个获取到网页HTML标签的方法。...写代码作为萌新要思考几件事： 1、这个代码的复用性； 2、这个代码的语义化以及功能解耦； 3、是否美观简洁，让别人看你的代码能很清楚的理解你的逻辑；代码展示： ''' 抓取每天的天气数据 python...第二步：拿到一个页面文件后，我们就需要观察一下该网页的HTML结构这里介绍一下如何观察一个网页的结构，打开F12或者，找个空白的位置右键——>检查我们大概会看到这样的一个情况：没错你看到那些<...在声明完数组后，我们就可调用刚才封装好的请求函数来请求我们要的URL并返回一个页面文件，接下来就是用Beautifulsoup4里面的语法，用lxml来解析我们的网页文件。

3K10 0

python3 爬虫学习：爬取豆瓣读书Top250（二）

上节我们讲到requests只是获取了网页数据，我们需要进一步，获取我们需要的并且能看懂的数据，这里需要用到新的库BeautifulSoup，他是一个HTML/XML的解析器，主要的功能是如何解析和提取...BeautifulSoup的简单介绍 pip install beautifulsoup4 BeautifulSoup可以很方便的从网页中抓取我们需要的数据，我们先来导入一下BeautifulSoup...() 方法接下来，我们来学习BeautifulSoup的常用方法：find()方法和find_all()方法 find()方法：用于返回符合查找条件的第一个数据 find_all()方法：用于返回符合查找条件的全部数据...()则输出了由所有标签组成的列表除了直接传入标签名作为参数之外，这两个方法还支持传入标签的属性，进行数据的提取，我们再来看个示例：我们想要提取书本名字，可以这样写打开豆瓣top250页面，...print('书名：{}\n链接：{}' .format(name , link)) ?

1.4K3 0

Requests库（十五）一文解决解析texthtml格式返回数据

（五）接口返回状态码 Requests库（六）接口返回响应头和请求Cookies Requests库（七）重定向和超时 Requests（八）代理和会话对象 Requests库（九）准备的请求和...24小时热闻 Requests库（十四）一文揭秘如何获取快手关注的视频 ---- 之前，我们都是分享的是解析json格式的请求，但是呢，今天给大家看下如何解析json格式呢。...官方有xml解析器，或者用beautifulsoup4。那么我们用beautifulsoup4来解析下。...find_reslut.a.get("href")) print(find_reslut.text) new_reslut = (s.find(class_='item-list').find_all...这里关于beautifulsoup4的使用，可以去参考官方文档即可。 ---- 如果觉得这篇文章还不错，来个【分享、点赞、在看】三连吧，让更多的人也看到~

5.1K2 1

分析了16年的福利彩票记录，原来可以用Python这么买彩票

我们点击下一页，看看网址链接是否有规律 http://kaijiang.zhcw.com/zhcw/html/ssq/list_1.html http://kaijiang.zhcw.com/zhcw/...3 代码实现在这里，我们获取网页的请求使用 requests 模块；解析网址借助 beautifulsoup4 模块。因为都是第三方模块，如环境中没有可以使用 pip 进行安装。...pip install requests pip install beautifulsoup4 pip install lxml 模块安装好之后，进行导入 import requests from bs4...save_to_file(content): with open('ssq.txt', 'a', encoding='utf-8') as f: f.write(content + '\n'...推荐阅读程序员进阶之路 --- 网络协议概观所有的不可描述都要从“我姐姐让我加你“的好友请求开始说起... 缓存更新的套路一次惊心动魄的服务器误删文件恢复过程

1.5K2 0

python爬虫之BeautifulSoup4使用

在解析时实际上依赖解析器。...说明当有多个节点时只取一个。...\n '] ''' 可以看到返回结果是列表形式。p 节点里既包含节点，又包含文本，最后统一返回列表。需要注意，列表中的每个元素都是 p 节点的直接子节点。...比如第一个 a 节点里面的span节点，这相当于子孙节点了，但返回结果并没有单独把span节点列出来。所以说，contents属性得到的结果是直接子节点的列表。...方法，还有 find 方法，不过 find 方法返回的是单个元素，也就是第一个匹配的元素，而 find_all 返回的是所有匹配的元素组成的列表。

1.3K2 0

04.BeautifulSoup使用

bs解析器.png 若是没有指定，会默认使用 html.parser，并且会出现警告，提示你没有指定。...soup.name #beautifulsoup4对象本身特殊,返回的是[document],不是列表。...获取Tag的上一个兄弟节点 12.previous_siblings:返回的是生成器 ---- （2）find_all（搜索文档树）: 1.find_all(name, attrs, recursive...例2: BeautifulSoup对象.find_all('a',text='China')#返回的是文本为China的a标签。...并且若标签内部没有文本 string 属性返回的是None ,而text属性不会返回None 3、Comment 的使用: 介绍:在网页中的注释以及特殊字符串。

2.2K3 0

Python爬虫库-Beautiful Soup的使用

若没有报错，则说明库已正常安装完成。...\n] # 没有id值为'footer'的div标签，所以结果返回为空 soup.find_all('div', id='footer') # [] 获取所有缩略图的 div...limit 参数 find_all() 返回的是整个文档的搜索结果，如果文档内容较多则搜索过程耗时过长，加上 limit 限制，当结果到达 limit 值时停止搜索并返回结果。...的搜索方法只会返回第一个满足要求的结果，等价于 find_all() 方法并将limit设置为1。...当没有搜索到满足条件的标签时，find() 返回 None，而 find_all() 返回一个空的列表。

1.6K3 0

Python爬虫库-BeautifulSoup的使用

若没有报错，则说明库已正常安装完成。...\n] # 没有id值为'footer'的div标签，所以结果返回为空 soup.find_all('div', id='footer') # [] 获取所有缩略图的 div...limit 参数 find_all() 返回的是整个文档的搜索结果，如果文档内容较多则搜索过程耗时过长，加上 limit 限制，当结果到达 limit 值时停止搜索并返回结果。...) 的搜索方法只会返回第一个满足要求的结果，等价于 find_all() 方法并将limit设置为1。...当没有搜索到满足条件的标签时，find() 返回 None，而 find_all() 返回一个空的列表。

1.8K3 0

HTML解析大法|牛逼的Beautiful Soup！

,那是 Beautiful Soup3 的发布版本,因为很多项目还在使用BS3, 所以 BeautifulSoup 包依然有效.但是如果你在编写新项目,那么你应该安装的 beautifulsoup4 )...如果你没有安装 easy_install 或 pip ,那你也可以下载BS4的源码 ,然后通过setup.py来安装...搜索指定名字的属性时可以使用的参数值包括字符串、正则表达式、列表、True。...recursive：调用tag的find_all()方法时，Beautiful Soup会检索当前tag的所有子孙节点，如果只想搜索tag的直接子节点，可以使用该参数并且将值为False。...find_all（）方法就讲解到这里

1.4K2 0

4K美女壁纸爬取

4K美女壁纸爬取一、前言拍了zhenguo的课程，今天继续学习课程同时，尝试使用BeautifulSoup4这个网页解析的方法爬取图片，看完后心血来潮，想自己也试一下。...2.通过分析可以看出，当页面变化时，index后面会发生改变，但在第一页时并没有数字显示，所以做出以下操作，通过input获取我们想要爬取的页数，使用if语句对index进行赋值，再传入要爬取的网址中。...3.接下来就是获取网页源代码了，使用requests.get拿到网页源代码，在打印时发现出现了乱码，根据网页源代码里的提示，规定格式为'gbk'，再获取bs对象main_page，指定解析器为'lxml...，需要的内容在标签div class='slist'的标签中,每一个li标签下的a标签包含了要爬取的每张图片的所有信息，所以使用find('div',class_='slist')先定位主标签，再使用find_all.../index.html 第二页 https://pic.netbian.com/4kmeinv/index_2.html 第三页 https://pic.netbian.com/4kmeinv/index

2.1K2 0

BeautifulSoup4用法详解

这篇文档介绍了BeautifulSoup4中所有主要特性,并且有小例子.让我来向你展示它适合做什么,如何工作,怎样使用,如何达到你想要的效果,和处理异常情况....的包,但那可能不是你想要的,那是 Beautiful Soup3 的发布版本,因为很多项目还在使用BS3, 所以 BeautifulSoup 包依然有效.但是如果你在编写新项目,那么你应该安装的 beautifulsoup4...] 返回结果中只有标签没有标签,因为标签还定义了”id”,没有返回和,因为和中没有定义”class”属性....的限制时,就停止搜索返回结果....() 方法的返回结果是值包含一个元素的列表,而 find() 方法直接返回结果. find_all() 方法没有找到目标是返回空列表, find() 方法找不到目标时,返回 None . print(soup.find

9.8K2 1

独家 | 手把手教你用Python进行Web抓取（附代码）

，避免了手工收集数据，节省了时间，还可以让所有数据都放在一个结构化文件中。...所有100个结果都包含在元素的行中，并且这些在一页上都可见。情况并非总是如此，当结果跨越多个页面时，您可能需要更改网页上显示的结果数量，或者遍历所有页面以收集所有信息。...刷新页面后，它将在加载时显示请求，如果响应包含格式化结构，则使用REST客户端（如Insomnia）返回输出通常更容易。 ?...它也不包含任何元素，因此在搜索元素时，不会返回任何内容。然后，我们可以通过要求数据的长度为非零来检查是否只处理包含数据的结果。然后我们可以开始处理数据并保存到变量中。...；拥有PMP证书，担任公司项目管理内训师，具有项目管理和系统开发实战经验。

4.7K2 0

Python爬虫库-BeautifulSoup的使用

若没有报错，则说明库已正常安装完成。...\n] # 没有id值为'footer'的div标签，所以结果返回为空 soup.find_all('div', id='footer') # [] 获取所有缩略图的 div...limit 参数 find_all() 返回的是整个文档的搜索结果，如果文档内容较多则搜索过程耗时过长，加上 limit 限制，当结果到达 limit 值时停止搜索并返回结果。...) 的搜索方法只会返回第一个满足要求的结果，等价于 find_all() 方法并将limit设置为1。...当没有搜索到满足条件的标签时，find() 返回 None，而 find_all() 返回一个空的列表。

2K0 0

BeautifulSoup解析html介绍

#pip install beautifulsoup4==4.0.1 #指定版本，不指定会安装最新版本 #pip install lxml==3.3.6 指定版本，不指定会安装最新版本...进入Python命令行试试是否安装成功 >>> import bs4 >>> import lxml >>> 没有报错，说明安装成功。...那么需要用到beautifulsoup的find_all函数，返回的结果应该是两个数据。当处理每一个数据时，里面的等标签都是唯一的，这时使用find函数。...) name = data.find('name').get_text() #print name 可以print测试解析结果这是beautifulsoup最简单的用法，find和find_all

1.7K2 0

Python爬虫技术系列-02HTML解析-BS4

BS4下载安装由于 Bautiful Soup 是第三方库，因此需要单独下载，下载方式非常简单，执行以下命令即可安装： pip install beautifulsoup4==4.11.1 -i https...limit：由于 find_all() 会返回所有的搜索结果，这样会影响执行效率，通过 limit 参数可以限制返回结果的数量 find()函数是find_all()的一种特例，仅返回一个值。...() 类似，不同之处在于 find_all() 会将文档中所有符合条件的结果返回，而 find() 仅返回一个符合条件的结果，所以 find() 方法没有limit参数。...("li", limit=1)一致 # 从结果可以看出，返回值为单个标签，并且没有被列表所包装。...如果没有找到查询标签会返回 None，而 find_all() 方法返回空列表。

9K2 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭