开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

BeautifulSoup find_all(text=True)不打印任何内容？

BeautifulSoup是一个用于解析HTML和XML文档的Python库。其中的find_all方法用于查找文档中符合指定条件的所有元素，并返回一个包含这些元素的列表。

在给定的问答内容中，使用了BeautifulSoup的find_all方法，并传入了参数text=True。这个参数的作用是指定只查找包含文本内容的元素。

如果使用BeautifulSoup的find_all(text=True)方法没有打印任何内容，可能有以下几个原因：

没有找到符合条件的元素：可能文档中没有包含符合条件的元素，或者条件设置不正确。可以检查一下文档的结构和内容，确认是否存在符合条件的元素。
元素的文本内容为空：有些元素可能存在，但是它们的文本内容为空。在使用find_all(text=True)时，只会返回非空的文本内容，所以如果元素的文本内容为空，就不会打印任何内容。
元素被注释掉了：有时候，文档中的元素可能被注释掉了，注释内容不会被当作文本内容处理。在使用find_all(text=True)时，注释内容也不会被返回，所以可能导致没有打印任何内容。

综上所述，如果使用BeautifulSoup的find_all(text=True)方法没有打印任何内容，可以检查一下文档的结构和内容，确认是否存在符合条件的元素，并且这些元素的文本内容不为空且没有被注释掉。

相关搜索:BeautifulSoup.findAll不打印任何内容 map.containsKey(key)返回true，但map.get(key)不返回任何内容 npm运行构建不起作用-不生成构建，脚本停止而不打印任何内容代码不工作，应打印程序，但未打印任何内容使用findByIdAndUpdate的NodeJS + Mongoose修补方法不返回任何内容，即使设置了新的:在选项中设置为true 即使内容存在，BeautifulSoup也不打印任何内容当语句为true时，json_encode不返回任何内容请求操作之前和之后的flask不工作/打印任何内容域名状态禁止转移域名备案后如何使用

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

如何利用BeautifulSoup库查找HTML上的内容

1.方法介绍 BeautifulSoup库给我们提供了一个find_all方法，如下： .find_all(name,attrs,recursive,string,**kwargs) find_all...如果我们要查找的网页是一个较大的网站，所涉及的标签内容很多，那么该如何查找呢？ To：加个for循环，即可打印出所有的标签信息。...") demo=r.text soup=BeautifulSoup(demo,"html.parser") for tag in soup.find_all(True): print(tag.name...第三个参数：recursive：是否对子孙标签全部检索，默认True。 1.对a标签是否进行子孙标签全部检索。...") demo=r.text soup=BeautifulSoup(demo,"html.parser") print(soup.find_all('a')) print(soup.find_all('

1.9K4 0

Python爬虫库-Beautiful Soup的使用

BeautifulSoup 对象初始化将一段文档传入 BeautifulSoup 的构造方法，就能得到一个文档对象。...也可以通过文件句柄来初始化，可先将HTML的源码保存到本地同级目录 reo.html，然后将文件名作为参数： soup = BeautifulSoup(open('reo.html')) 可以打印 soup...指定名字的属性参数值可以包括：字符串、正则表达式、列表、True/False。 True/False 是否存在指定的属性。...搜索包含 Reeoo 字符串的标签： soup.find_all(string=re.compile("Reeoo")) 打印搜索结果可看到包含3个元素，分别是对应标签里的内容，具体见下图所示 ?...limit 参数 find_all() 返回的是整个文档的搜索结果，如果文档内容较多则搜索过程耗时过长，加上 limit 限制，当结果到达 limit 值时停止搜索并返回结果。

1.6K3 0

Python爬虫库-BeautifulSoup的使用

BeautifulSoup 对象初始化将一段文档传入 BeautifulSoup 的构造方法，就能得到一个文档对象。...也可以通过文件句柄来初始化，可先将HTML的源码保存到本地同级目录 reo.html，然后将文件名作为参数： soup = BeautifulSoup(open('reo.html')) 可以打印 soup...指定名字的属性参数值可以包括：字符串、正则表达式、列表、True/False。 True/False 是否存在指定的属性。...搜索包含 Reeoo 字符串的标签： soup.find_all(string=re.compile("Reeoo")) 打印搜索结果可看到包含3个元素，分别是对应标签里的内容，具体见下图所示 ?...limit 参数 find_all() 返回的是整个文档的搜索结果，如果文档内容较多则搜索过程耗时过长，加上 limit 限制，当结果到达 limit 值时停止搜索并返回结果。

1.8K3 0

Python爬虫库-BeautifulSoup的使用

也可以通过文件句柄来初始化，可先将HTML的源码保存到本地同级目录 reo.html，然后将文件名作为参数： soup = BeautifulSoup(open('reo.html')) 可以打印 soup...指定名字的属性参数值可以包括：字符串、正则表达式、列表、True/False。 True/False 是否存在指定的属性。...搜索包含 Reeoo 字符串的标签： soup.find_all(string=re.compile("Reeoo")) 打印搜索结果可看到包含3个元素，分别是对应标签里的内容，具体见下图所示 ?...limit 参数 find_all() 返回的是整个文档的搜索结果，如果文档内容较多则搜索过程耗时过长，加上 limit 限制，当结果到达 limit 值时停止搜索并返回结果。...*声明：推送内容及图片来源于网络，部分内容会有所改动，版权归原作者所有，如来源信息有误或侵犯权益，请联系我们删除或授权事宜。 - END -

2K0 0

Python 页面解析：Beautiful Soup库的使用

： 2.1 find_all() find_all() 方法用来搜索当前 tag 的所有子节点，并判断这些节点是否符合过滤条件，最后以列表形式将符合条件的内容返回，语法格式如下： find_all...text：用来搜文档中的字符串内容，该参数可以接受字符串、正则表达式、列表、True。...")) 上面程序使用 find_all() 方法，来查找页面中所有的标签、标签和"Python"字符串内容。...find(name, attrs, recursive, text) 除了和 find_all() 相同的使用方式以外，bs4 为 find() 方法提供了一种简写方式： soup.find("li...x = requests.get('https://www.csdn.net/') soup = BeautifulSoup(x.text, 'lxml') img_list = soup.select

1.6K2 0

一文入门BeautifulSoup

提取步骤使用Beautiful Soup4提取HTML内容，一般要经过以下两步：处理源代码生成BeautifulSoup对象使用find_all()或者find()来查找内容快速入门使用的是\...主要是有两种方法： find_all() find() 前者用的比较更为广泛 find_all() find_all(name, attrs, recursive, text, **kwargs) find_all...传入True True 可以匹配任何值,下面代码查找到所有的tag,但是不会返回字符串节点 ? 传入方法如果没有合适过滤器，那么还可以定义一个方法，方法只接受一个元素参数。...text 通过text参数来搜索文档中的字符串内容。与name参数的可选值相同：字符串、正则表达式、列表、True ?...注意点：select 方法返回的都是列表形式的内容，可以遍历获取，通过get_text方法获取具体内容 ?

3.9K0 0

python爬虫：BeautifulSoup库基础及一般元素提取方法

://python123.io/ws/demo.html' r = requests.get(url) demo = r.text # 服务器返回响应 soup = BeautifulSoup(demo...()) # 使用prettify()格式化显示输出得到一个BeautifulSoup对象后，一般通过BeautifulSoup类的基本元素来提取html中的内容 2.提取html中的信息 demo...介绍一下find_all()方法常用通过find_all()方法来查找标签元素： .find_all(name, attrs, recursive, string, **kwargs) 返回一个列表类型...>…中字符串区域的检索字符串 (1) print('所有a标签的内容：', soup.find_all('a')) # 使用find_all()方法通过标签名称查找a标签,返回的是一个列表类型 print...# 如果给出的标签名称是True，则找到所有标签 print('标签名称：', i.name) # 打印标签名称 (4) print('href属性为http..的a标签元素是:', soup.find_all

7653 0

数据获取：网页解析之BeautifulSoup

find_all() 说到搜索，最常使用的肯定是BeautifulSoup的find_all()方法，它会搜索当前 tag 的所有 tag 子孙节点，并判断每个节点是否符合过滤器的条件。...find_all()方法的完整参数为find_all(name, attrs, recursive, text,limit, **kwargs): name：标签名称的过滤，支持正则 attrs：标签的属性条件的过滤...，支持正则； recursive：bool选项，如果为True，find_all()将遍历所有节点，否则只有子节点，默认为True； text：标签中的文本过滤，； limit：搜索限制过滤，如果不为空...如果是获取标签的文本，直接使用get_text()方法，可以获取到标签的文本内容。...]) #打印标签文本内容 print(links[0].get_text()) 代码结果：第一个链接 link1.html 不管是使用lxml还是Beautiful Soup，多数结果都是获取文本内容或者是标签的属性值

1793 0

精品教学案例 | 基于Python3的证券之星数据爬取

当遇到list嵌套list的时候，尽量不选择BeautifulSoup而使用xpath，因为BeautifulSoup会用到2个find_all()，而xpath会省下不少功夫。...[i.get_text() for i in soup.find('thead', class_='tbody_right').find_all('td')] 代码释义： .get_text()是完成从标签里取出正文内容这一步... class_='tbody_right').find_all('tr')][0:5] BeautifulSoup获取表头的代码为： [i.get_text() for i in soup.find(...(tree.xpath('//thead[@class="tbody_right"]//td//text()')) BeautifulSoup获取内容的代码为： [[j.get_text() for...此外，将打印前两页数据进行局部展示。

2.7K3 0

Python爬虫学习笔记之爬虫基础库

""" from bs4 import BeautifulSoup soup = BeautifulSoup(html_doc, 'html.parser') 通过这段例子来演示怎样从文档的一段内容找到另一段内容...回到顶部 beautifulsoup的搜索文档树 find_all find_all( name , attrs , recursive , string , **kwargs ) find_all()...True 可以匹配任何值,下面代码查找到所有的tag,但是不会返回字符串节点 for tag in soup.find_all(True): print(tag.name) '''...] text 参数通过 text 参数可以搜搜文档中的字符串内容.与 name 参数的可选值一样, text 参数接受字符串 , 正则表达式 , 列表, True import re...回到顶部 beautifulsoup的css选择器我们在写 CSS 时，标签名不加任何修饰，类名前加点，id名前加 #，在这里我们也可以利用类似的方法来筛选元素，用到的方法是 soup.select(

1.8K2 0

Python3网络爬虫(七)：使用Beautiful Soup爬取小说

(2)搜索文档树 find_all(name, attrs, recursive, text, limit, **kwargs)： find_all() 方法搜索当前tag的所有tag子节点...： True 可以匹配任何值,下面代码查找到所有的tag,但是不会返回字符串节点： for tag in soup.find_all(True): print(tag.name) ...4)text参数通过 text 参数可以搜搜文档中的字符串内容，与 name 参数的可选值一样, text 参数接受字符串 , 正则表达式 , 列表, True。...= BeautifulSoup(str(texts), 'lxml') #将\xa0无法解码的字符删除 print(soup_text.div.text.replace('\xa0',...+ '\n\n') #将爬取内容写入文件 for each in soup_text.div.text.replace('\xa0','

4.3K8 0

第一个爬虫——豆瓣新书信息爬取

二、解析数据 #解析数据 soup = BeautifulSoup(data.text, 'lxml') #暂不输出print(soup) 在这里将网页数据data转化为了 BeautifulSoup...一般用find()找到BeautifulSoup对象内任何第一个标签入口。 ''' 最后一句将两个图书信息快，存储到一个列表内，方便后续统一操作。...)方法：用来获取标签里面的文本内容，在括号里面加"strip=True"可以去除文本前后多余的空格 titles.append(title) #print(title) #评价星级...rating = book.find('p',{'class':'rating'}).get_text(strip=True) #rating = rating.replace('\n...仔细分析检查元素中的源代码和对应的网页元素，可轻松找到网页显示内容的一行、两行代码。我们就用 find 和 find_all 去对这一两行进行操作。 ? ? ? ? ? ?

7553 0

BeautifulSoup使用

通过点取属性的方式只能获得当前名字的第一个tag,如果想要得到所有的标签,或是通过名字得到比一个tag更多的内容的时候,就需要用到 Searching the tree 中描述的方法,比如: find_all...很简单，用 .string 即可，例如print soup.p.string #The Dormouse's story BeautifulSoup BeautifulSoup 对象表示的是一个文档的全部内容...print soup.a.string 搜索文档树 find_all( name , attrs , recursive , text , **kwargs ) find_all() 方法搜索当前...] select 我们在写 CSS 时，标签名不加任何修饰，类名前加点，id名前加 #，在这里我们也可以利用类似的方法来筛选元素，用到的方法是 soup.select()，select 方法返回的结果都是列表形式...，可以遍历形式输出，然后用 get_text() 方法来获取它的内容。

9403 0

六、解析库之Beautifulsoup模块

: print(soup.find_all(['a','b'])) #1.4、True：可以匹配任何值,下面代码查找到所有的tag,但是不会返回字符串节点 print(soup.find_all(True..., text , **kwargs ) #2、find_all( name , attrs , recursive , text , **kwargs ) #2.1、name: 搜索name参数的值可以使任一类型的...: 值可以是：字符，列表，True，正则 print(soup.find_all(text='Elsie')) print(soup.find_all('a',text='Elsie')) #2.6、...soup("a") 这两行代码也是等价的: soup.title.find_all(text=True) soup.title(text=True) ''' 3、find( name , attrs..., recursive , text , **kwargs ) #3、find( name , attrs , recursive , text , **kwargs ) find_all() 方法将返回文档中符合条件的所有

1.6K6 0

四、网页信息存储和 BeautifulSoup之find用法

网页信息存储和 BeautifulSoup之find用法前言一、BeautifulSoup之find用法 find find_all 具体使用示例二、网页信息存储 1.基础知识...---- 一、BeautifulSoup之find用法 BeautifulSoup有find 和find_all的方法。但在使用之前一定要先建立一个beautifulsoup对象。...参数 find_all 返回所有匹配到的结果，区别于find（find只返回查找到的第一个结果）语法： find_all(name, attrs, recursive, text, limit, *...也就是说，新的内容将会被写入到已有内容之后。如果该文件不存在，创建新文件进行写入。 r+ Read+Write打开一个文件用于读写。文件指针将会放在文件的开头。...(req.text,'lxml')#使用BeautifulSoup的lxml解析网页 description=soup.find('span',class_="absolute").text.strip

4091 0

二、爬虫基础库

""" from bs4 import BeautifulSoup soup = BeautifulSoup(html_doc, 'html.parser') 通过这段例子来演示怎样从文档的一段内容找到另一段内容...beautifulsoup的搜索文档树 find_all 1 find_all( name , attrs , recursive , string , **kwargs ) find_all() 方法搜索当前...True 可以匹配任何值,下面代码查找到所有的tag,但是不会返回字符串节点 for tag in soup.find_all(True): print(tag.name) '''...] text 参数通过 text 参数可以搜搜文档中的字符串内容.与 name 参数的可选值一样, text 参数接受字符串 , 正则表达式 , 列表, True import re...beautifulsoup的css选择器我们在写 CSS 时，标签名不加任何修饰，类名前加点，id名前加 #，在这里我们也可以利用类似的方法来筛选元素，用到的方法是 soup.select()，返回类型是

1.7K9 0

爬虫必备Beautiful Soup包使用详解

find_all()——获取所有符合条件的内容 Beautiful Soup提供了一个find_all()方法，该方法可以获取所有符合条件的内容。...语法格式如下： find_all(name = None, attrs = {}, recursive = True, text = None, limit = None, **kwargs) • 1....(text='零基础学Python')) # 打印指定字符串所获取的内容 print('指定正则表达式对象所获取的内容如下：') print(soup.find_all(text=re.compile...(text='零基础学Python')) # 打印指定字符串所获取的内容 print('指定正则表达式对象所获取的内容如下：') print(soup.find_all(text=re.compile...attrs={'value':'4'})) # 打印第一个value为4的节点内容 print(soup.find(text=re.compile('Python'))) # 打印第一个文本中包含

2.5K1 0

一文入门Beautiful Soup4

提取步骤使用Beautiful Soup4提取HTML内容，一般要经过以下两步：处理源代码生成BeautifulSoup对象使用find_all()或者find()来查找内容快速入门使用的是$...首先判断了它的类型，是否为 Comment 类型，然后再进行其他操作，如打印输出。...() find() 前者用的比较更为广泛 find_all() find_all(name, attrs, recursive, text, **kwargs) name find_all() 方法搜索当前...True 可以匹配任何值,下面代码查找到所有的tag,但是不会返回字符串节点 [007S8ZIlgy1ghj6vl2muwj30tc0gmq40.jpg] 传入方法如果没有合适过滤器，那么还可以定义一个方法...通过text参数来搜索文档中的字符串内容。

9442 1

Python-数据解析-Beautiful Soup-中

find_all(self, name=None, attrs={}, recursive=True, text=None, limit=None, **kwargs) ① name 参数查找所有名字为...传入字符串：在搜索的方法中传入一个字符串，BeautifulSoup 对象会查找与字符串完全匹配的内容。...对象会将与列表中任一元素匹配的内容返回。...": "key"}) ③ text 参数通过在 find_all() 方法中传入 text 参数，可以搜索文档中的字符串内容。...soup.find_all("a", limit=5) ⑤ recursive 参数在调用 find_all() 方法时，BeautifulSoup 对象会检索当前节点的所有子节点。

1.2K3 0

Python爬虫（三）：BeautifulSoup库

class="tl"> Hello BeautifulSoup ''' 我们前面看的例子中 tag 中的字符串内容都不是注释内容，现在将字符串内容换成注释内容，我们来看一下效果：...1）find_all() find_all() 方法搜索当前 tag 的所有 tag 子节点，方法详细如下：find_all(name=None, attrs={}, recursive=True, text...参数可以搜搜文档中的字符串内容，它接受字符串、正则表达式、列表、True，示例如下： from bs4 import BeautifulSoup import re soup = BeautifulSoup...=['head','title'])) #True soup.find_all(text=True) limit 参数与 SQL 中的 limit 关键字类似，用来限制搜索的数据，示例如下： soup...'})) 2）find() 方法详细如下：find(name=None, attrs={}, recursive=True, text=None,**kwargs)，我们可以看出除了少了 limit 参数

1.5K2 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭