开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

美汤类名有多个空格，find_all提供[]

美汤类名有多个空格，find_all提供[] 是一个关于美汤类名和BeautifulSoup库中的find_all方法的问题。

美汤类名指的是HTML标签中的class属性值，有时候class属性值中会包含多个空格。在使用BeautifulSoup库进行HTML解析时，可以使用find_all方法来查找指定class属性值的标签。

find_all方法的参数可以是一个字符串、一个正则表达式、一个函数或一个列表。当参数是一个列表时，BeautifulSoup会查找class属性值与列表中的任意一个元素匹配的标签。

对于美汤类名有多个空格的情况，可以使用find_all方法的参数为一个列表，列表中的元素是class属性值的各个部分，以空格分隔。这样就可以找到class属性值中包含多个空格的标签。

以下是一个示例代码：

from bs4 import BeautifulSoup

html = '''
<div class="美汤  类名">标签1</div>
<div class="美汤   类名">标签2</div>
<div class="美汤    类名">标签3</div>
'''

soup = BeautifulSoup(html, 'html.parser')
tags = soup.find_all(class_=["美汤", "类名"])

for tag in tags:
    print(tag.text)

输出结果为：

标签1
标签2
标签3

在这个例子中，我们使用了find_all方法的class_参数，将参数值设置为一个包含两个元素的列表，分别是"美汤"和"类名"。这样就可以找到class属性值中包含多个空格的标签，并输出它们的文本内容。

推荐的腾讯云相关产品和产品介绍链接地址：

腾讯云服务器（CVM）：https://cloud.tencent.com/product/cvm
腾讯云对象存储（COS）：https://cloud.tencent.com/product/cos
腾讯云数据库（TencentDB）：https://cloud.tencent.com/product/cdb
腾讯云人工智能（AI）：https://cloud.tencent.com/product/ai
腾讯云物联网（IoT）：https://cloud.tencent.com/product/iot
腾讯云区块链（Blockchain）：https://cloud.tencent.com/product/baas
腾讯云元宇宙（Metaverse）：https://cloud.tencent.com/product/metaverse

请注意，以上链接仅供参考，具体产品选择应根据实际需求进行评估。

相关搜索:Reactjs:删除包含多个类名的div标记的类名之间的空格带有指定类的ul上的美汤find_all返回none，而不管指定的类是什么。Find_all在同一程序中的不同用户界面上工作如何在没有Python语言find_all函数硬编码索引的情况下，从美汤中的同一个类和属性中抓取多个信息？没有提供聚类键条件的排序，当有多个聚类键时？js 正负相加 jsp三层引号 js进度条显示 js 弹出元素 js 内部链接 js 获取描述

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

一文入门BeautifulSoup

直接子节点 tag的名称一个Tag可能包含多个字符串或其它的Tag,这些都是这个Tag的子节点。 Beautiful Soup提供了许多操作和遍历子节点的属性，比如直接获取tag的name值： ?...如果存在多个子节点，tag就没法确定了，输出的结果就是None 多个节点 strings repr()方法的使用 ? ?...主要是有两种方法： find_all() find() 前者用的比较更为广泛 find_all() find_all(name, attrs, recursive, text, **kwargs) find_all...CSS选择器在写CSS的时候，类名前加上点，id名前加上#。使用soup.select()的方法类筛选元素，返回的类型是list 标签名查找 ? 类名查找 ? id名查找 ?...组合查找组合查找即和写 class 文件时，标签名与类名、id名进行的组合原理是一样的，例如查找 p 标签中，id 等于 link1的内容，二者需要用空格分开标签属性 ? 直接查找子标签 ?

3.9K0 0

一文入门Beautiful Soup4

.previous_siblings 属性通过 .next_siblings 和 .previous_siblings 属性可以对当前节点的兄弟节点迭代输出搜索文档树在BS4中搜索文档树主要是有两种方法...： find_all() find() 前者用的比较更为广泛 find_all() find_all(name, attrs, recursive, text, **kwargs) name find_all...[007S8ZIlgy1ghj8kbfovmj318c0h042e.jpg] CSS选择器在写CSS的时候，类名前加上点，id名前加上#。...使用soup.select()的方法类筛选元素，返回的类型是list 标签名查找 [007S8ZIlgy1ghj8qa2m11j318u0go0wc.jpg] 类名查找 [007S8ZIlgy1ghj8tdpi5kj318g0j6wiz.jpg...] id名查找 [007S8ZIlgy1ghj8utwhvdj317s05mdgp.jpg] 组合查找组合查找即和写 class 文件时，标签名与类名、id名进行的组合原理是一样的，例如查找 p 标签中

9692 1

python爬虫之BeautifulSoup

通过类名查找 1.6.3. 通过id名查找 1.6.4. 组合查找 1.6.5. 属性查找 1.7. 修改文档树 1.7.1. 修改tag的名称和属性 1.7.2....它是一个工具箱，通过解析文档为用户提供需要抓取的数据，因为简单，所以不需要多少代码就可以写出一个完整的应用程序。...get("class") css选择器我们在写 CSS 时，标签名不加任何修饰，类名前加点，id名前加#，在这里我们也可以利用类似的方法来筛选元素，用到的方法是 soup.select()，返回类型是..." id="link2">Lacie, Tillie] 通过类名查找...-- Elsie -->] 同样，属性仍然可以与上述查找方式组合，不在同一节点的空格隔开，同一节点的不加空格,代码如下： print soup.select('p a[href="http

8822 0

美团 2025 届校招开始了，岗位 and 原题抢先看！！

北斗计划是美团面向全球精尖校园科技人才的招聘项目，性质有一点点类似于华为的「天才少年」，但难度和待遇自然是不能和华为比的，可简单将「北斗计划」理解为算法岗中的 SP/SSP 吧。...来都来了，做一道和「美团」相关的算法原题，这是一道去年的校招原题。题目描述平台：LeetCode 题号：808 有 A 和 B 两种类型的汤，一开始每种类型的汤有 n 毫升。...有四种分配操作：提供 100ml 的汤A 和 0ml 的汤B 。提供 75ml 的汤A 和 25ml 的汤B 。提供 50ml 的汤A 和 50ml 的汤B 。...：提供 4ml 的汤A 和 0ml 的汤B 。...提供 3ml 的汤A 和 1ml 的汤B 。提供 2ml 的汤A 和 2ml 的汤B 。提供 1ml 的汤A 和 3ml 的汤B 。

6331 0

不能再简单了｜手把手教你爬取美国疫情实时数据

大家好，最近一直有读者在后台留言说早起能不能写一下怎么获取国外的疫情数据、美国疫情数据怎么爬之类的。为了满足各位，今天就说一下如何爬取美国疫情数据。...废话不多说，直接开始，只需一台电脑，按照下面的顺序一步一步执行，爬不下来数据你打我，文末不提供源码，源码一字不少全在文中。 https://coronavirus.1point3acres.com/?...哦豁，报错了，从报错代码来看说明返回的并不能解析为json数据，没事不慌，bs4登场，我们用美丽的汤试试 soup = BeautifulSoup(res.text) soup ? 搞定?...我们想要的数据都在这汤(soup)里了，取出来不就完事了，这时候F12就不得不登场了，回到浏览器刚刚的页面按下F12 ?...name = s[0].find_all('span')[0].text k = s[0].find_all('span')[1].text confirmed = (int(re.findall(r"

1.5K2 1

干了这碗“美丽汤”，网页解析倍儿爽

但可惜掌握它需要一定的学习成本，原本我们有一个网页提取的问题，用了正则表达式，现在我们有了两个问题。 HTML 文档本身是结构化的文本，有一定的规则，通过它的结构可以简化信息提取。...BeautifulSoup（下文简称 bs）翻译成中文就是“美丽的汤”，这个奇特的名字来源于《爱丽丝梦游仙境》（这也是为何在其官网会配上奇怪的插图，以及用《爱丽丝》的片段作为测试文本）。...可以有多个搜索条件叠加，比如find('a', id='link3', class_='sister') find 返回的是一个bs4.element.Tag 对象，这个对象可以进一步进行搜索。...如果有多个满足的结果，find只返回第一个；如果没有，返回 None。...\n\n' 如果你有前端开发经验，对 CSS 选择器很熟悉，bs 也为你提供了相应的方法： soup.select('html head title') # [The Dormouse's

9712 0

干了这碗“美丽汤”，网页解析倍儿爽

但可惜掌握它需要一定的学习成本，原本我们有一个网页提取的问题，用了正则表达式，现在我们有了两个问题。 ? HTML 文档本身是结构化的文本，有一定的规则，通过它的结构可以简化信息提取。...BeautifulSoup（下文简称 bs）翻译成中文就是“美丽的汤”，这个奇特的名字来源于《爱丽丝梦游仙境》（这也是为何在其官网会配上奇怪的插图，以及用《爱丽丝》的片段作为测试文本）。...可以有多个搜索条件叠加，比如find('a', id='link3', class_='sister') find 返回的是一个bs4.element.Tag 对象，这个对象可以进一步进行搜索。...如果有多个满足的结果，find只返回第一个；如果没有，返回 None。...\n\n' 如果你有前端开发经验，对 CSS 选择器很熟悉，bs 也为你提供了相应的方法： soup.select('html head title')# [The Dormouse's

1.3K2 0

BeautifulSoup4库

strings 和 stripped_strings strings：如果tag中包含多个字符串，可以使用 .strings 来循环获取 stripped_strings：输出的字符串中可能包含了很多空格或空行...的使用： find和find_all方法：搜索文档树，一般用得比较多的就是两个方法，一个是find，一个是find_all。...tag.has_attr('class') and not tag.has_attr('id') # # print(soup.find_all(name=has_class_but_no_id)) # 有class...以下列出几种常用的css选择器方法：（1）通过标签名查找： print(soup.select('a')) （2）通过类名查找：通过类名，则应该在类的前面加一个.。...示例代码如下： print(soup.select("#link1")) （4）组合查找：组合查找即和写 class 文件时，标签名与类名、id名进行的组合原理是一样的，例如查找 p 标签中，id 等于

1.1K1 0

python爬虫（三）数据解析，使用bs4工具

示例代码如下：根据对象，直接点出标签名称，就可以获得标签和标签里面的东西，如果有多个，直接获取第一个; (from bs4 import BeautifulSoup) html = """ <html...8 搜索文档树 8.1 find和find_all方法：搜索文档树，一般用得比较多的就是两个方法，一个是find，一个是find_all。...以下列出几种常用的css选择器方法：（1）通过标签名查找： print(soup.select('a')) （2）通过类名查找：通过类名，则应该在类的前面加一个.。...示例代码如下： print(soup.select("#link1")) （4）组合查找：组合查找即和写 class 文件时，标签名与类名、id名进行的组合原理是一样的，例如查找 p 标签中，id 等于...")) （5）通过属性查找：查找时还可以加入属性元素，属性需要用中括号括起来，注意属性和标签属于同一节点，所以中间不能加空格，否则会无法匹配到。

8781 0

python3网络爬虫(抓取文字信息)

爬虫的大概思路其实就两点: 获取网页的HTML信息解析HTML信息,提取我们真正需要的内容一前言二网络爬虫简介 1.审查元素 chrome:F12 2.简单实例网络爬虫根据提供的URL信息...req.text) 运行代码,会发现得到的是一堆带有各种HTML标签的小说内容.接下来的目标就是讲小说的内容提取出来,过滤掉这些没用的HTML标签. (3)Beautiful Soup 提取我们真正需要的内容有很多方法...这里div设置了两个属性class和id.id是div的唯一标识,class规定元素的一个或多个类名....从图片中可以看出,此时的内容中还有一些其他的HTML标签,比如接下来就是要把这些不需要的字符去除,还有一些不需要的空格也删除.代码如下: 1 # -*- coding:utf-8 -*-...在HTML中用" "表示空格(记得后面加;号).上面代码的最后一行的意思就是: 去掉文中的8个空格符号,并能用回车代替.

6.9K4 0

Beautiful Soup与运用（猫眼电影榜单）

BeautifulSoup(html, 'lxml') print(soup.prettify())#以标准的缩进格式输出print(soup.title.string) 节点选择器在此可以认为soup是一锅汤，...soup.节点就是选择相应的食材获取名称语法格式：soup.节点.name 如soup.p.title 获取属性 soup.节点名['属性名'] 如soup.p[class'] soup.p.attrs...enumerate(soup.a.previous_siblings))) 这类语法只会匹配第一个节点，后面的将会被忽略方法选择器节点选择器：通过属性选择，这种方法快，但是复杂选择就比较繁琐方法选择器：灵活 find_all...() 返回所有元素 find_all(name , attrs , recursive , text , **kwargs) name参数： soup.findall(name='ul') attrs参数...releasetime': '上映时间：1993-07-01(中国香港)', 'score': '9.2'} {'index': '9', 'name': '千与千寻', 'star': '主演：柊瑠美,

5202 0

Python爬虫学习笔记之爬虫基础库

它是一个工具箱，通过解析文档为用户提供需要抓取的数据，因为简单，所以不需要多少代码就可以写出一个完整的应用程序。...回到顶部 beautifulsoup的css选择器我们在写 CSS 时，标签名不加任何修饰，类名前加点，id名前加 #，在这里我们也可以利用类似的方法来筛选元素，用到的方法是 soup.select(...title>The Dormouse's story] print(soup.select("b")) #[The Dormouse's story] （2）通过类名查找...class="sister" href="http://example.com/elsie" id="link1">Elsie] （4）组合查找组合查找即和写 class 文件时，标签名与类名...、id名进行的组合原理是一样的，例如查找 p 标签中，id 等于 link1的内容，二者需要用空格分开 print(soup.select("p #link2")) #[<a class="sister

1.8K2 0

Python爬虫入门教程：豆瓣读书练手爬虫

我们有了目标信息，就需要找到信息所在的页面源码，然后通过解析源码来获取到信息数据。那么，我们怎样获得页面 HTML 源代码呢？翻阅兵书，我们知道可以使用requests之计。...开始工作现在我们要用到BeautifulSoup的find_all()选择器，因为我们这一页有很多书，而每一本书的信息都包含在class=pl2的div标签内，我们使用find_all()就可以直接得到本页所有书的书名了...这里我们使用zip()函数，zip()函数在运算时，会以一个或多个序列做为参数，返回一个元组的列表。同时将这些序列中并排的元素配对。...代码如下： # 文件名filename = '豆瓣图书Top250.txt'# 保存文件操作with open(filename, 'w', encoding='utf-8') as f: # 保存数据...书名：追风筝的人作者：[美] 卡勒德·胡赛尼 / 李继宏 / 上海人民出版社 / 2006-5 / 29.00元评分：8.8简介：为你，千千万万遍==================# ...# ...

6951 0

商汤自曝近况：明年或IPO、无人车大单、不寻常的美研、C轮将完

在完整版的报道中，有更多关于商汤科技的近况披露出来。包括：IPO时间表、1亿美元的无人车大单、不寻常的美研设立目的…… 首谈IPO：可能明年，也可能后年 “我们并不着急，资金从来都不是问题。...汤晓鸥说，目前正寻找一名合适的财务负责人。可能汤教授这次披露的一些消息，商汤也不是人尽皆知。例如当时只有路透两段话快讯发布的时候，商汤给量子位发来的回应是：公司有未来上市计划，但是并无具体时间表。...不过，汤晓鸥谈及这次商汤决定开设美研，却给出一个不同寻常的理由。汤晓鸥说，商汤美研目的是为了与合作伙伴们更好地一起工作。...在人脸识别上，我们能和Facebook竞争，在视觉物体识别上，我们能和Google竞争，能对1000类物体进行分类”。...汤晓鸥介绍说，商汤有一个专利的技术框架，叫做Parrots，和谷歌的TensorFlow差不多，在营收、客户规模和业务范围上都远胜于国内对手。

9727 0

用BeautifulSoup来煲美味的汤

你可能会问BeautifulSoup：美味的汤？这个东西能干嘛？为什么起这个名字呢？先来看一下官方的介绍。...来去掉空格，这部分后面实战部分有介绍。...如果输出的字符串中包含了很多空格或空行，则可以使用 .stripped_strings 来去除多余的空白内容（包括空格和空行）。...find_all()语法格式： find_all(name, attrs , recursive , text , **kwargs) 通过一个简单的例子，来感受一下它的魅力： soup.find_all...好了本篇关于用BeautifulSoup来煲美味的汤的介绍就到此为止了，感谢你的赏阅！

1.8K3 0

二、爬虫基础库

Tag,这些都是这个Tag的子节点.Beautiful Soup提供了许多操作和遍历子节点的属性....beautifulsoup的css选择器我们在写 CSS 时，标签名不加任何修饰，类名前加点，id名前加 #，在这里我们也可以利用类似的方法来筛选元素，用到的方法是 soup.select()，返回类型是...title>The Dormouse's story] print(soup.select("b")) #[The Dormouse's story] （2）通过类名查找...class="sister" href="http://example.com/elsie" id="link1">Elsie] （4）组合查找组合查找即和写 class 文件时，标签名与类名...、id名进行的组合原理是一样的，例如查找 p 标签中，id 等于 link1的内容，二者需要用空格分开 print(soup.select("p #link2")) #[<a class="sister

1.7K9 0

第一个爬虫——豆瓣新书信息爬取

它是一个特殊字符串头，是一种向访问网站提供你所使用的浏览器类型及版本、操作系统及版本、浏览器内核、等信息的标识。...通过这个标识，用户所访问的网站可以显示不同的排版从而为用户提供更好的体验或者进行信息统计；例如用不同的设备访问同一个网页，它的排版就会不一样，这都是网页根据访问者的UA来判断的。...通过观察，发现图书的内容分别包管在左右“虚构类”和“非虚构类”两个标签下。 ? 对应在网页源代码中的表现是 ?...在括号里面加 "strip=True" 可以去除文本前后多余的空格，效果同replace(' ','')和replace('\n','')。...封面图片链接：https://img1.doubanio.com/view/subject/m/public/s32305167.jpg 书名：为何，以及如何谋划一场火灾评分：8.7 作者及出版信息：[美]

7693 0

21.8 Python 使用BeautifulSoup库

它可以自动将复杂的HTML文档转换为树形结构，并提供简单的方法来搜索文档中的节点，使得我们可以轻松地遍历和修改HTML文档的内容。广泛用于Web爬虫和数据抽取应用程序中。...，如果为 True 或 None，则查找所有标签元素attrs：字典，用于指定属性名和属性值，用于查找具有指定属性名和属性值的元素recursive：布尔值，表示是否递归查找子标签，默认为 Truetext...：字符串或正则表达式，用于匹配元素的文本内容limit：整数，限制返回的匹配元素的数量kwargs：可变参数，用于查找指定属性名和属性值的元素我们以输出CVE漏洞列表为例，通过使用find_all查询页面中所有的...5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98"}# 查找文中所有a标签且类名是...它会自动去除每个文本的前后空格和换行符，只返回纯文本字符串。stripped_strings可以用于处理HTML文档中的多行文本、空格等特殊符号，也可用于将元素下面的所有字符串以列表的形式返回。

2052 0

21.8 Python 使用BeautifulSoup库

它可以自动将复杂的HTML文档转换为树形结构，并提供简单的方法来搜索文档中的节点，使得我们可以轻松地遍历和修改HTML文档的内容。广泛用于Web爬虫和数据抽取应用程序中。...，如果为 True 或 None，则查找所有标签元素 attrs：字典，用于指定属性名和属性值，用于查找具有指定属性名和属性值的元素 recursive：布尔值，表示是否递归查找子标签，默认为 True...text：字符串或正则表达式，用于匹配元素的文本内容 limit：整数，限制返回的匹配元素的数量 kwargs：可变参数，用于查找指定属性名和属性值的元素我们以输出CVE漏洞列表为例，通过使用find_all...(Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98"} # 查找文中所有a标签且类名是...它会自动去除每个文本的前后空格和换行符，只返回纯文本字符串。stripped_strings可以用于处理HTML文档中的多行文本、空格等特殊符号，也可用于将元素下面的所有字符串以列表的形式返回。

2606 0

Python爬虫之BeautifulSoup解析之路

BeautifulSoup的介绍第一次使用BeautifulSoup的时候就在想：这个名字有什么含义吗？美味的汤？于是好信也在网上查了一下。...它有如下几个使其强大的特点：它提供了几个超级简单的方法和Pythonic的语句来实现强大的导航、搜索、修改解析树的功能。...print(soup.html.string) >>> None 如果tag中包含多个字符串,可以使用 .strings 来循环获取，输出的字符串中可能包含了很多空格或空行，使用 .stripped_strings...BeautifulSoup的搜索文档树搜索文档树有很多种用法，但使用方法都基本一致。这里只选择介绍一种 .find_all。...也可以同时定义多个关键字条件来过滤匹配结果。

1.8K1 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭