文章/答案/技术大牛

发布

问BeautifulSoup:搜索.text属性
EN

Stack Overflow用户

提问于 2018-12-31 05:16:49

回答 2查看 187关注 0票数 1

我有以下情况

from bs4 import BeautifulSoup
html = '''<span class='generic'><span>Hey</span><span>Joe</span></span>'''
soup = BeautifulSoup(html, 'lxml')
tag = soup.find('span', text="HeyJoe")
print(tag)

打印None。

但如果我跑了

soup.find('span', text="Hey").parent.text

它返回HeyJoe，因此它返回“完整”文本，包括子文本。我相信text=函数的find()参数也会搜索到“全文”，也就是说，搜索到.text标记。

我必须找到父span标记(带有类generic的标记)。

我想通过调用搜索到BeautifulSoup元素的.text函数来做到这一点。以便在搜索前将所有子标记中的文本连接起来。有这样的功能吗？

我无法使用类来查找标记，因为在实际情况下，它是一个被许多标记广泛使用的非常通用的类。
我不想用span文本搜索子Hey，然后检索父文件，因为这在实际情况下也是相当通用的。

没有方法搜索元素的.text属性吗？

python

web-scraping

beautifulsoup

回答 2

Stack Overflow用户

回答已采纳

发布于 2018-12-31 06:00:36

您可以尝试使用下面的方法通过完整的文本内容span找到"HeyJoe"节点。

tag = [span for span in soup.findAll('span') if span.text == "HeyJoe"][0]

票数 1

Stack Overflow用户

发布于 2018-12-31 05:57:00

从你的措辞来看，你想做什么根本不清楚。

如果您想要搜索特定的模式，可以使用re.compile并将其直接传递给BeautifulSoup的text=关键字参数。

soup.find("span", text=re.compile("Hey"))

这将返回页面上任何span标记中字符串“嘿嘿”的第一个实例(如果有的话)。如果您希望大小写不敏感，请使用：

soup.find("span", text=re.compile("Hey", re.IGNORECASE))

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/53987945

复制

CSS text-decoration 属性

text

<html> <head> <style type="text/css"> h1 {text-decoration: overline} h2 {text-decoration: line-through} h3 {text-decoration: underline} h4 {text-decoration:blink} a {text-decoration: none} </style> </head> <body> <h1>这是标题 1</h1> <h2>这是标题 2</h2> <h3>这是标

Twcat_tree

2023/02/20

2200

CSS 文本装饰 text-decoration属性

css

在CSS中，使用 text-decoration属性，可以在文本上方、下方、或中间添加装饰线，可选值为 none | underline | overline | line-through | blink，默认值为 none。none 无装饰，underline 下划线，overline 上划线，line-through 文字中间贯穿线，blink 闪烁。装饰线的颜色与文本的颜色相同。

用户7886150

2020/11/11

1.3K0

html+css学习笔记005-font属性0text属性

html css

Author：Mr.柳上原付出不亚于任何的努力愿我们所有的努力，都不会被生活辜负不忘初心，方得始终像我这样的人最近总是单曲循环的播放着这首《像我这样的人》听很久都不会觉得腻或许这首歌最大的魅力就是共鸣 “ 像我这样迷茫的人像我这样寻找的人像我这样碌碌无为的人像我这样孤单的人像我这样傻的人像我这样不甘平凡的人世界上有多少人 ” <!DOCTYPE html>  <html lang='en'> <!-- html根标签翻译文字：英文 -

Mr. 柳上原

2018/09/05

8240

【HarmonyOS 专题】03 简单了解 Text 文本属性

编程算法 xml

和尚在之前尝试通过 XML 构建一个最基础的【登录】页面，其中使用了 Image / Button / Text / TextField 等几个最常用的小控件；和尚逐一进行学习尝试；

阿策小和尚

2021/09/17

5880

BeautifulSoup库

xml java html html5 python

注意:如果是html的父标签就是他自己,soup本身也是种特殊的标签的他的父标签是空

小小咸鱼YwY

2019/07/23

8880

自己常用的 Sublime Text3 属性设置

urllib 编辑器插件工作系统

用过了诸多的编辑器，Atom、VSCode、Webstorm 等等，最终我还是留在了 Sublime Text3 阵营，其优点对于我来说必定是多余其他编辑器。比如启动速度快、有强大且完善的插件社区等。因为经常换工作系统和环境，所以记录一下 Sublime Text3 的一些常用的用户设置。不用每次都去查询了。

我与梦想有个约会

2023/10/20

2040

BeautifulSoup库

html html5 python xml

python爬虫抛开其它，主要依赖两类库：HTTP请求、网页解析；这里requests可以作为网页请求的关键库，BeautifulSoup库则是网页内容解析的关键库；爬虫架构分为五部分：调度器、URL管理器、网页下载器、网页解析器、应用程序等。

Mirror王宇阳

2020/11/13

9680

BeautifulSoup 简述

xml html python java

处理数据，总要面对 HTML 和 XML 文档。BeautifulSoup 是一个可以从 HTML 或 XML 中提取数据的 Python 库，功能强大、使用便捷，诚为朴实有华、人见人爱的数据处理工具。

IT茂茂

2020/03/05

1.1K0

text-align属性对position:absloute/fixed的元素无效

css

text-align属性对position:absloute/fixed的元素无效

javascript.shop

2019/09/04

1.9K0

text-align属性对position:absloute/fixed的元素无效

BeautifulSoup使用

其他

Beautiful Soup将复杂HTML文档转换成一个复杂的树形结构,每个节点都是Python对象,所有对象可以归纳为4种: Tag , NavigableString , BeautifulSoup , Comment .

听城

2018/08/30

9660

python BeautifulSoup

beautifulsoup text

通过BeautifulSoup库的get_text方法找到网页的正文： #!/usr/bin/env python #coding=utf-8 #HTML找出正文 import requests from bs4 import BeautifulSoup url='http://www.baidu.com' html=requests.get(url) soup=BeautifulSoup(html.text) print soup.get_text()

py3study

2020/01/09

5620

Leetcode|BST属性|700. BST搜索

dfs root 队列

注意格式最好写成if..else if而不是if...if if (val < root->val) {...} else if (val > root->val) {...} 否则，容易将上一个if改变后的root代入到下一个if中 if (val < root->val) {...} if (val > root->val) {...} 1 DFS /** * Definition for a binary tree node. * struct TreeNode { * int v

SL_World

2021/09/18

2790

Python：bs4中 string 属性和 text 属性的区别及背后的原理

编程算法 python

刚开始接触 bs4 的时候，我也很迷茫，觉得 string 属性和 text 属性是一样的，不明白为什么要分成两个属性。

丹枫无迹

2019/01/22

8430

Python-数据解析-Beautiful Soup-中

编程算法正则表达式

网页中有用的信息都存在于网页中的文本或者各种不同标签的属性值，为了能获取这些有用的网页信息，可以通过一些查找方法获取文本或者标签属性。

小团子

2019/07/18

1.2K0

beautifulsoup的使用

html html5

['\n Once upon a time there were three little sisters; and their names were\n ', Elsie , '\n', Lacie, ' \n and\n ', Tillie, '\n and they lived at the bottom of a well.\n ']

hankleo

2020/09/17

6870

BeautifulSoup与aiohtt

php

　　香港电台的节目素质都比较不错，其中有个《中华五千年》的节目是以情景剧与旁白的形式来展示历史故事，由传说时代一直到民国，1983年首播至2000年，非常长寿的一个节目。网上能找到版本声音非常模糊，不过在其《网上中华五千年》的网站上可以在线收听所有节目。虽然可以在线听，但要science上网，而且在线听中断了就不能再续着听，很难受。因此，就想到利用Python来的爬虫来把节目都下载下来慢慢听。

py3study

2020/01/16

5900

BeautifulSoup4

遍历对象搜索语法字符串

参考链接：https://github.com/DeronW/beautifulsoup/blob/v4.4.0/docs/index.rst

TomatoCool

2023/07/30

2620

BeautifulSoup文档4-详细方法 | 用什么方法对文档树进行搜索？

编程算法正则表达式

BeautifulSoup的文档搜索方法有很多，官方文档中重点介绍了两个方法： find() 和 find_all() 下文中的实例，依旧是官网的例子： html_doc = """ <html><head><title>The Dormouse's story</title></head> <body> <p class="title"><b>The Dormouse's story</b></p> <p class="story">Once upon a time there were three

虫无涯

2023/02/22

9910

点击加载更多

相似问题

BeautifulSoup抓取.text属性问题

232

BeautifulSoup搜索属性-值

BeautifulSoup Python NoneType对象没有属性'text‘

BeautifulSoup ...文本：“”NoneType“”对象没有属性“”text“”

文本：“”NoneType“”对象没有属性“”text“”- Beautifulsoup“”

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

问BeautifulSoup:搜索.text属性
EN

回答 2

Stack Overflow用户

Stack Overflow用户

BeautifulSoup抓取.text属性问题

BeautifulSoup搜索属性-值

BeautifulSoup Python NoneType对象没有属性'text‘

BeautifulSoup ...文本：“”NoneType“”对象没有属性“”text“”

文本：“”NoneType“”对象没有属性“”text“”- Beautifulsoup“”

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问BeautifulSoup:搜索.text属性EN

回答 2

Stack Overflow用户

Stack Overflow用户

BeautifulSoup抓取.text属性问题

BeautifulSoup搜索属性-值

BeautifulSoup Python NoneType对象没有属性'text‘

BeautifulSoup ...文本：“”NoneType“”对象没有属性“”text“”

文本：“”NoneType“”对象没有属性“”text“”- Beautifulsoup“”

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问BeautifulSoup:搜索.text属性
EN