腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
2
回答
使用
BeautifulSoup
查找
类
中
的
H
标记
python
、
beautifulsoup
我在计算一篇文章
中
的
所有
H
标签时遇到了一点问题,我需要将搜索保持在主文章
类
中
-代码
的
一部分。它看起来像这样。>But I dont want to find this
H
3-tag</
h
3> 运行这段代码将在页面上显示所有到
H
4
的
H
1
标记
,并计算页眉和页脚,它们都在文章
类
之外。for heading in soup.find_all([
浏览 32
提问于2021-09-01
得票数 0
回答已采纳
1
回答
如何用HTMLParser读取内部标签?
python
、
html
、
python-3.x
、
html-parsing
在HTML文件
中
的
某个地方,我有一个内部
标记
如下
的
div: <
h
3><a href="#">TEXT</a></
h
3>如何
使用
Python
中
的
HTMLParser
类
查找
a元素
中
<
浏览 0
提问于2013-04-12
得票数 0
回答已采纳
10
回答
我们可以在
BeautifulSoup
中
使用
XPath吗?
python
、
web-scraping
、
xpath
、
beautifulsoup
、
urllib
我正在
使用
BeautifulSoup
抓取一个网址,我
使用
了以下代码来
查找
其
类
为'empformbody'
的
td
标记
import urllib2 url = "http://www.example.com/servlet/av/ResultTemp
浏览 2
提问于2012-07-13
得票数 135
回答已采纳
3
回答
如何识别哪些HTML
标记
或
类
指定何时从网页抓取?
python
、
html
、
web-scraping
、
beautifulsoup
我想在一个网站上抓取新闻链接(在下面的截图中突出显示):当我inspect页面时,我看到我想要
的
链接包含在标签
h
5下
的
类
col-sm-5
中
。我想刮掉div
类
col-sm-5
中
的
所有4个链接(
使用
标记
col-sm-5)。(page.text, "html.parser") li_box = soup.find('
h
5', attrs={'c
浏览 0
提问于2018-05-23
得票数 1
回答已采纳
3
回答
使用
BeautifulSoup
在DIV
类
内
的
H
标记
中
查找
部分文本
python
、
html
、
python-3.x
、
web-scraping
、
beautifulsoup
我在DIV
类
内容中有一个HTML,它看起来像 <
h
2> Brookstone AS20194 Multi-functional Massage Chair</
h
2> 我
的
Python代码是 soup.find('div',attrs={'class':'content'}).
h
2.text 然后它会返回 Brookstone
浏览 31
提问于2020-06-09
得票数 1
回答已采纳
1
回答
无法识别链接
类
python-2.7
、
web-scraping
、
beautifulsoup
我对编程和Python非常陌生,并且正在尝试编写这个简单
的
刮板,从这个页面中提取治疗师
的
所有配置文件URLs。import requests p = '&page='<div class="member-summary"> <
h
2 class=""&g
浏览 0
提问于2015-04-28
得票数 1
回答已采纳
4
回答
当存在相同
的
标记
时,如何
使用
BeautifulSoup
提取文本,这是没有用
的
python
、
web-scraping
、
beautifulsoup
我正在做一些网络抓取,我需要在<p>段落之间
的
文本。_SX40_SY40_SS40_.jpg" height=${avatar.image.size} width=${avatar.image.size}></a><img width="102" height="12" alt="3/10" src=&q
浏览 3
提问于2016-04-20
得票数 1
回答已采纳
1
回答
为什么漂亮汤找不到我要找
的
html元素?
python
、
beautifulsoup
我正试图从coinbase
中
获取加密货币价格
的
变化,方法是用漂亮
的
汤进行解析。在coinbase网站()上,我可以找到价格变化
的
html元素。<
h
4 class="TextElement__Spacer-hxkcw5-0 caIgfs Header__StyledHeader-sc-1xiyexz-0 dLILyj">+0.33%</
h
4>然后,在python
中
,我通过查看
h
4
标记
浏览 1
提问于2020-06-14
得票数 2
回答已采纳
2
回答
使用
python正则表达式
的
HTML解析
python
、
html
、
regex
我
使用
python正则表达式来解析html文件,现在我需要从html
标记
中提取一个数字,这个数字可以是整数,也可以是浮点数。以下是两个例子:<span class='addr-bbs'>2 baths</span><span class='addr-bbs'>3.5 baths</span> 我
的
原始代码是= re.findall('<span class=\"addr_bbs\
浏览 2
提问于2016-07-11
得票数 0
回答已采纳
2
回答
在HTML
中
查找
文本搜索元素
的
标记
python
、
html
、
web-scraping
、
beautifulsoup
我试图刮多个网页来比较书
的
价格。因为每个站点都有不同
的
布局(和
类
名),所以我希望
使用
regex和周围
的
元素找到这本书
的
标题。下面给出了一个代码示例。from bs4 import
BeautifulSoup
<div class='product-box'> <
h
2 class='title'我知道,当
浏览 2
提问于2019-11-11
得票数 0
回答已采纳
1
回答
在一组表格下选择一组特定
的
单元格,
使用
python和漂亮汤
python
、
html
、
parsing
、
beautifulsoup
表
的
共同点是它们
的
类
是相同
的
,考虑到"table_class."We需要同一列下
的
内容第三列,标题是每个table.Contents
的
标题意思,第三列
中
的
href链接来自所有行。您应该将每个href链接逐个打印在单独
的
行
中
。
使用
属性进行筛选
的
无效,因为某些
标记
具有不同
的
属性。单元格
的
位置是唯一可用
的<
浏览 58
提问于2015-04-09
得票数 1
回答已采纳
1
回答
如何通过Python
BeautifulSoup
中
的
特定文本找到
标记
?
python
、
html
、
web-scraping
、
beautifulsoup
您知道如何在pythons
BeautifulSoup
中
搜索特定
的
文本吗?
查找
标记
??更好
的
标记
完整路径,包含一些string。例如,BS4
的
常用用法是:from bs4 import
BeautifulSoup
website = requests.get(ur
浏览 4
提问于2022-09-04
得票数 0
回答已采纳
2
回答
在
BeautifulSoup
中将一种
标记
替换为另一种
标记
python
、
html
、
parsing
、
python-3.x
、
beautifulsoup
我有一个HTML文件
的
集合。我希望逐个迭代它们,编辑特定
类
的
标记
。我希望编辑
的
代码如下所示,
使用
以下
类
名: <a id='123' class='thisIsMyOtherClass' href='123'>Put me Elsewhere</a> 这可以在同一个文档
浏览 5
提问于2014-12-01
得票数 6
回答已采纳
1
回答
基于
h
3日期和相关列表项修改HTML
python
、
html
、
beautifulsoup
我希望有一个脚本来完成以下工作: earlierRemoves 读取文件在
h
3
标记
中
查找
昨天
的
日期,或
查找
与无关
的
所有日期。任何洞察力都会受到极大
的
赞赏--我已经和
BeautifulSoup
混在一起了,但我不确定我是否有足够
的
经验或知识把它整合在一起。下面是我
的
尝试,它成功地删除了昨天
h
3
标记
之间
的
日期,但我不知道如何处理与前面的
h</e
浏览 6
提问于2022-05-21
得票数 -1
回答已采纳
1
回答
BeautifulSoup
获取与
类
最近
的
标记
,而不是嵌套在未知同级
中
的
同级
标记
python
、
beautifulsoup
<
h
3> <span class='headline'>Headline #1</span><table class='striped'></我正在枚举table标签,并且想要检索span标签
的
文本值,其中包含一个离我
的
表最近
的
'headline‘
类
。所
浏览 17
提问于2019-01-25
得票数 0
回答已采纳
2
回答
使用
beautifulSoup
和print访问属性
python
、
beautifulsoup
我想刮一个站点来
查找
h
2标签
的
所有标题属性
使用
这段代码,我将访问整个
h
2
标记</
浏览 2
提问于2018-03-30
得票数 0
回答已采纳
2
回答
BeautifulSoup
:搜索.text属性
python
、
web-scraping
、
beautifulsoup
我有以下情况html = '''<span class='generic'><span>Hey</span><span>Joe</span></span>'''tag = soup.find('span',
浏览 0
提问于2018-12-31
得票数 1
回答已采纳
1
回答
查找
h
3元素
中
的
所有锚元素
python-3.x
、
beautifulsoup
我有这段代码来
查找
h
3
标记
中
的
所有
标记
元素(有
h
3父元素),但不幸
的
是,它返回了一个空列表。r = requests.get('some_url_here')a=soup.find_all('
h
3>a')
浏览 2
提问于2020-12-26
得票数 0
回答已采纳
2
回答
使用
BeautifulSoup
拉取标签值
python
、
parsing
、
tags
、
beautifulsoup
有人能告诉我如何
使用
BeautifulSoup
拉取标签
的
值吗?我阅读了文档,但很难浏览它。例如,如果我有:我怎么才能
使用
BeautifulSoup
/Python拉出"Funstuff编辑:我正在
使用
版本3.2.1
浏览 1
提问于2012-07-24
得票数 6
回答已采纳
2
回答
Python通过Visual问题应用刮刀
python
、
web-scraping
、
beautifulsoup
我只想打印第一个可用
的
网球选手作为一个单独
的
项目,并排除所有在它之后
的
项目,那么我需要在代码
中
更改什么来做到这一点呢?请注意,我通过Visual 2022完成了此操作,并将该程序应用于
使用
Microsoft浏览器。import requests response = requests.get("https://www.betexplorer.com/tennisatp-singles
浏览 3
提问于2022-10-30
得票数 1
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
腾讯会议
活动推荐
运营活动
广告
关闭
领券