腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
具有
相
同类
名
的
BeautifulSoup
抓取
标记
、
、
我是
BeautifulSoup
的
新手。我正在使用Python和bs进行一些web
抓取
,并且我有两个
具有
相
同类
名
的
段落。metadata'>Wed 1 Jan 2020 00:01 GMT</p><p class='metadata'>Category: <span>UK-News</span></p> 我正在尝试获取span标签中
的</e
浏览 29
提问于2021-04-16
得票数 1
1
回答
使用
BeautifulSoup
抓取
具有
相
同类
名
的
多个数据
、
、
我正在尝试
抓取
这个网站
的
‘最近销售’部分(所有地址):listings = []下面哪一项包含所有地
浏览 0
提问于2020-03-04
得票数 0
2
回答
BeautifulSoup
在
标记
中
的
代码片段中找到一个键值
、
我
的
目标是从页面源中获取“sitekey”
的
值。代码
的
片段是。所讨论
的
页面是soup =
BeautifulSoup
(url,'html.parser')不工作,因为有多个
具有
相
同类
名
的
div
标记
。编辑: def sitek
浏览 4
提问于2017-04-23
得票数 1
回答已采纳
3
回答
Excel VBA
抓取
具有
相
同类
名
的
li
标记
、
、
、
我正在尝试
抓取
共享相
同类
名
的
li
标记
,HTML代码如下所示:<ul class="top-section-list" data-selenium="highlightList"><li class="top-section-list-item">sample text# 5</li> 下面是我
的
VBA代码,它只能<
浏览 7
提问于2017-12-04
得票数 2
3
回答
具有
不
同类
名
的
BeautifulSoup
- find_all div
标记
、
我想选择所有的<div>,其中类名为post has-profile bg2或post has-profile bg1,而不是最后一个,即panel<div id="7" class="post has-profile bg1"> some text 2 </div> <div id="8" class="post ha
浏览 0
提问于2018-07-30
得票数 2
回答已采纳
2
回答
在
BeautifulSoup
中对特定类进行过滤
、
、
、
、
我用
BeautifulSoup
做了这样
的
事情:当我使用这个过滤器时,我
的
理解是我将得到所有带有属性或类
名
name
的
name
标记
。但是,我不希望div
标记
的
每个实例都
具有
属性name。我想要某些实例,其中它们定位在HTML文件
的
某个子树中。更具体地说,
标记
<u1 class
浏览 8
提问于2017-08-15
得票数 0
回答已采纳
3
回答
使用
BeautifulSoup
抓取
-使用相
同类
名
的
问题
、
、
我
的
目标是获得以下列
的
单独列表: close、open、volume和date。我
的
问题是,对于volume、open和close列,类
名
(text-center)是相同
的
(例如第一行): <th scope="row" class="font-semibold text-center></td>N/A </td&g
浏览 61
提问于2021-11-21
得票数 2
回答已采纳
1
回答
使用
BeautifulSoup
.find()进行网络
抓取
总是不返回
、
、
DOM
的
相关部分:from bs4 import
BeautifulSoup
page = requests.get(URL) soup =
BeautifulSoup
(page.content, 'html.parser
浏览 4
提问于2022-05-29
得票数 -1
1
回答
具有
相
同类
的
多个元素
、
、
、
在我正在
抓取
的
网站上,有2个
具有
相
同类
('ul', class_='list')
的
元素。当我运行时: syn = soup.find('ul', class_='list') print(syn.text) 我只获得了类('ul', class_='list')
的
第一个元素
的
文本 如何才能获得
具有
相
同类
名</
浏览 23
提问于2020-10-01
得票数 0
回答已采纳
2
回答
无法从python中
的
html页面提取文本
、
、
我对网络
抓取
非常陌生。我读到了关于
BeautifulSoup
的
文章,并试图使用它。但我无法提取
具有
给定类
名
“company-desc-and-排序容器”
的
文本。我甚至不能从html页面中提取标题。这是我尝试过
的
代码:import requests url= 'http://fortune.com/best-com
浏览 5
提问于2016-12-20
得票数 1
回答已采纳
1
回答
Python bs4不从元素返回文本
、
、
我正在尝试
抓取
reverb.com以获取不同乐器
的
名称。我找到了保存仪器名称文本
的
元素,但由于某种原因,
标记
返回为空。我将在下面提供我
的
代码。对于为什么会发生这种情况,有什么想法吗?import requests url = 'https://reverb.com/marketplace?我检查过了,它们似乎都有
具有
相
同类
的</
浏览 9
提问于2021-02-18
得票数 0
2
回答
如何从java脚本中刮取经度
、
、
、
我对
BeautifulSoup
4
相
当陌生,在从javascript中提取纬度和经度值时遇到了困难。文件很长,我必须准备所有纬度
的
数据帧。Java脚本文件将
具有
如下字符串:这里
的
标记
i
浏览 3
提问于2020-07-16
得票数 1
回答已采纳
1
回答
查找
具有
相
同类
名
的
多个表,Python webscraping
、
我正在尝试使用Python4和
BeautifulSoup
抓取
具有
相
同类
名
的
多个表。from bs4 import
BeautifulSoup
standingsPage = requests.get(standingsURL) standingsSoup
浏览 7
提问于2020-04-25
得票数 0
1
回答
通过facebook营销api获取facebook
的
最新广告类型及其需求
、
、
、
、
我一直在看上
的
facebook api文档,但还没有找到解决方案。我只是想得到facebook
的
最新广告类型
的
列表,这些类型列在这个页面上:以及每种广告
的
规格。是否可以通过API实现?我只是想澄清一下,我不想访问某个特定facebook账户
的
广告或活动。我只想通过API动态获取facebook
的
最新广告类型和每种广告类型
的
要求,而不必将这些信息存储在我
的
数据库中,以避免手动保持最新信息。我意识到这不是一个特定
的
编码问题,但如果可以的话
浏览 25
提问于2020-10-28
得票数 2
1
回答
.findall()在
BeautifulSoup
中没有返回所有"tr“
标记
、
、
我不明白为什么.find_all()没有返回我搜索
的
所有
标记
。基本上,我试图
抓取
并获取所有"tr“
标记
的
列表(主要是对
标记
中
的
标记
感兴趣),但它只返回嵌套在
标记
中
的
第一个"tr”
标记
,并且我假设它永远不会到达。最终目标:我只需要从表体
的
每一行中提取酒
名
。def web_parser1(): from bs
浏览 6
提问于2022-04-06
得票数 0
回答已采纳
2
回答
如何使用
BeautifulSoup
获取带有类
的
div
的
内容?
、
如何使用web
抓取
类获取div
的
内容?import re br = mechanize.BrowserTrue)
浏览 5
提问于2015-04-08
得票数 1
回答已采纳
1
回答
使用Scrapy获取
具有
相
同类
名
的
多个元素
的
列表
、
有一个我想要
抓取
的
网站,它有许多
具有
相
同类
名
的
div。 例如,假设这个类
名
是article-container,站点中有12个div包含这个类
名
。解决这个问题
的
最佳方法是什么?
浏览 3
提问于2019-12-12
得票数 1
2
回答
Python -
Beautifulsoup
循环使用相
同类
名
的
div
标记
、
、
、
、
我想知道如何从一个网站上删除信息,其中有多个元素
具有
相同
的
标识符,我希望从这些标识符中删除价格数据。我遇到
的
问题是,当我循环遍历每个div和print()时,我会在控制台中多次看到它
的
粘贴。我假设这是du div,我正在定位
具有
相同
标记
+类
名
的
封装多个元素。£859.99£1,049.99£829.99£899.99£999.95£999.95 £999.95
浏览 2
提问于2022-06-13
得票数 -1
2
回答
从python中
的
span
标记
获取类
名
、
我对数据
抓取
很陌生,我正在使用
BeautifulSoup
从网页中获取一些数据。我正在尝试在span
标记
中获取r100。我知道r100是类
名
,但是这个数据是必需
的
。有可能吗?我
的
代码print(st2)<span class="rating r100"></span>
浏览 3
提问于2021-04-04
得票数 0
回答已采纳
1
回答
无法使用
BeautifulSoup
抓取
HTML
标记
,引发NoneType
、
、
、
我在这里有这个脚本,它可以
抓取
一些超文本
标记
语言:for i inhtmlbs: p
浏览 0
提问于2020-11-12
得票数 0
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券