首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >BeautifulSoup:搜索.text属性

BeautifulSoup:搜索.text属性
EN

Stack Overflow用户
提问于 2018-12-31 05:16:49
回答 2查看 187关注 0票数 1

我有以下情况

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
from bs4 import BeautifulSoup
html = '''<span class='generic'><span>Hey</span><span>Joe</span></span>'''
soup = BeautifulSoup(html, 'lxml')
tag = soup.find('span', text="HeyJoe")
print(tag)

打印None

但如果我跑了

soup.find('span', text="Hey").parent.text

它返回HeyJoe,因此它返回“完整”文本,包括子文本。我相信text=函数的find()参数也会搜索到“全文”,也就是说,搜索到.text标记。

我必须找到父span标记(带有类generic的标记)。

我想通过调用搜索到BeautifulSoup元素的.text函数来做到这一点。以便在搜索前将所有子标记中的文本连接起来。有这样的功能吗?

  1. 我无法使用类来查找标记,因为在实际情况下,它是一个被许多标记广泛使用的非常通用的类。
  2. 我不想用span文本搜索子Hey,然后检索父文件,因为这在实际情况下也是相当通用的。

没有方法搜索元素的.text属性吗?

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2018-12-31 06:00:36

您可以尝试使用下面的方法通过完整的文本内容span找到"HeyJoe"节点。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
tag = [span for span in soup.findAll('span') if span.text == "HeyJoe"][0]
票数 1
EN

Stack Overflow用户

发布于 2018-12-31 05:57:00

从你的措辞来看,你想做什么根本不清楚。

如果您想要搜索特定的模式,可以使用re.compile并将其直接传递给BeautifulSoup的text=关键字参数。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
soup.find("span", text=re.compile("Hey"))

这将返回页面上任何span标记中字符串“嘿嘿”的第一个实例(如果有的话)。如果您希望大小写不敏感,请使用:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
soup.find("span", text=re.compile("Hey", re.IGNORECASE))
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/53987945

复制
相关文章
CSS text-decoration 属性
<html> <head> <style type="text/css"> h1 {text-decoration: overline} h2 {text-decoration: line-through} h3 {text-decoration: underline} h4 {text-decoration:blink} a {text-decoration: none} </style> </head> <body> <h1>这是标题 1</h1> <h2>这是标题 2</h2> <h3>这是标
Twcat_tree
2023/02/20
2200
CSS text-decoration 属性
CSS 文本装饰 text-decoration属性
在CSS中,使用 text-decoration属性,可以在文本上方、下方、或中间添加装饰线,可选值为 none | underline | overline | line-through | blink,默认值为 none。none 无装饰,underline 下划线 ,overline 上划线,line-through 文字中间贯穿线,blink 闪烁。装饰线的颜色与文本的颜色相同。
用户7886150
2020/11/11
1.3K0
html+css学习笔记005-font属性0text属性
Author:Mr.柳上原 付出不亚于任何的努力 愿我们所有的努力,都不会被生活辜负 不忘初心,方得始终 像我这样的人 最近总是单曲循环的播放着这首《像我这样的人》 听很久都不会觉得腻 或许这首歌最大的魅力就是共鸣 “ 像我这样迷茫的人 像我这样寻找的人 像我这样碌碌无为的人 像我这样孤单的人 像我这样傻的人 像我这样不甘平凡的人 世界上有多少人 ” <!DOCTYPE html> <!-- 文档类型:标准html文档 --> <html lang='en'> <!-- html根标签 翻译文字:英文 -
Mr. 柳上原
2018/09/05
8240
【HarmonyOS 专题】03 简单了解 Text 文本属性
和尚在之前尝试通过 XML 构建一个最基础的【登录】页面,其中使用了 Image / Button / Text / TextField 等几个最常用的小控件;和尚逐一进行学习尝试;
阿策小和尚
2021/09/17
5880
BeautifulSoup库
注意:如果是html的父标签就是他自己,soup本身也是种特殊的标签的他的父标签是空
小小咸鱼YwY
2019/07/23
8880
自己常用的 Sublime Text3 属性设置
用过了诸多的编辑器,Atom、VSCode、Webstorm 等等,最终我还是留在了 Sublime Text3 阵营,其优点对于我来说必定是多余其他编辑器。比如启动速度快、有强大且完善的插件社区等。因为经常换工作系统和环境,所以记录一下 Sublime Text3 的一些常用的用户设置。不用每次都去查询了。
我与梦想有个约会
2023/10/20
2040
BeautifulSoup库
python爬虫抛开其它,主要依赖两类库:HTTP请求、网页解析;这里requests可以作为网页请求的关键库,BeautifulSoup库则是网页内容解析的关键库;爬虫架构分为五部分:调度器、URL管理器、网页下载器、网页解析器、应用程序等。
Mirror王宇阳
2020/11/13
9680
BeautifulSoup 简述
处理数据,总要面对 HTML 和 XML 文档。BeautifulSoup 是一个可以从 HTML 或 XML 中提取数据的 Python 库,功能强大、使用便捷,诚为朴实有华、人见人爱的数据处理工具。
IT茂茂
2020/03/05
1.1K0
text-align属性对position:absloute/fixed的元素无效
text-align属性对position:absloute/fixed的元素无效
javascript.shop
2019/09/04
1.9K0
text-align属性对position:absloute/fixed的元素无效
BeautifulSoup使用
Beautiful Soup将复杂HTML文档转换成一个复杂的树形结构,每个节点都是Python对象,所有对象可以归纳为4种: Tag , NavigableString , BeautifulSoup , Comment .
听城
2018/08/30
9660
python BeautifulSoup
通过BeautifulSoup库的get_text方法找到网页的正文: #!/usr/bin/env python #coding=utf-8 #HTML找出正文 import requests from bs4 import BeautifulSoup url='http://www.baidu.com' html=requests.get(url) soup=BeautifulSoup(html.text) print soup.get_text()
py3study
2020/01/09
5620
Leetcode|BST属性|700. BST搜索
注意 格式最好写成if..else if而不是if...if if (val < root->val) {...} else if (val > root->val) {...} 否则,容易将上一个if改变后的root代入到下一个if中 if (val < root->val) {...} if (val > root->val) {...} 1 DFS /** * Definition for a binary tree node. * struct TreeNode { * int v
SL_World
2021/09/18
2790
Python:bs4中 string 属性和 text 属性的区别及背后的原理
刚开始接触 bs4 的时候,我也很迷茫,觉得 string 属性和 text 属性是一样的,不明白为什么要分成两个属性。
丹枫无迹
2019/01/22
8430
Python-数据解析-Beautiful Soup-中
网页中有用的信息都存在于网页中的文本或者各种不同标签的属性值,为了能获取这些有用的网页信息,可以通过一些查找方法获取文本或者标签属性。
小团子
2019/07/18
1.2K0
Python-数据解析-Beautiful Soup-中
beautifulsoup的使用
['\n Once upon a time there were three little sisters; and their names were\n ', Elsie , '\n', Lacie, ' \n and\n ', Tillie, '\n and they lived at the bottom of a well.\n ']
hankleo
2020/09/17
6870
BeautifulSoup与aiohtt
  香港电台的节目素质都比较不错,其中有个《中华五千年》的节目是以情景剧与旁白的形式来展示历史故事,由传说时代一直到民国,1983年首播至2000年,非常长寿的一个节目。网上能找到版本声音非常模糊,不过在其《网上中华五千年》的网站上可以在线收听所有节目。虽然可以在线听,但要science上网,而且在线听中断了就不能再续着听,很难受。因此,就想到利用Python来的爬虫来把节目都下载下来慢慢听。
py3study
2020/01/16
5900
BeautifulSoup4
参考链接:https://github.com/DeronW/beautifulsoup/blob/v4.4.0/docs/index.rst
TomatoCool
2023/07/30
2620
BeautifulSoup文档4-详细方法 | 用什么方法对文档树进行搜索?
BeautifulSoup的文档搜索方法有很多,官方文档中重点介绍了两个方法: find() 和 find_all() 下文中的实例,依旧是官网的例子: html_doc = """ <html><head><title>The Dormouse's story</title></head> <body> <p class="title"><b>The Dormouse's story</b></p> <p class="story">Once upon a time there were three
虫无涯
2023/02/22
9910
点击加载更多

相似问题

BeautifulSoup抓取.text属性问题

232

BeautifulSoup搜索属性-值

23

BeautifulSoup Python NoneType对象没有属性'text‘

22

BeautifulSoup ...文本:“”NoneType“”对象没有属性“”text“”

10

文本:“”NoneType“”对象没有属性“”text“”- Beautifulsoup“”

14
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文