具有相同类名的BeautifulSoup抓取标记

文章/答案/技术大牛

发布

1回答

、、

我是BeautifulSoup的新手。我正在使用Python和bs进行一些web抓取，并且我有两个具有相同类名的段落。metadata'>Wed 1 Jan 2020 00:01 GMT</p><p class='metadata'>Category: <span>UK-News</span></p> 我正在尝试获取span标签中的</e

浏览 29提问于2021-04-16得票数 1

1回答

使用BeautifulSoup抓取具有相同类名的多个数据

、、

我正在尝试抓取这个网站的‘最近销售’部分(所有地址)：listings = []下面哪一项包含所有地

浏览 0提问于2020-03-04得票数 0

2回答

BeautifulSoup在标记中的代码片段中找到一个键值

、

我的目标是从页面源中获取“sitekey”的值。代码的片段是。所讨论的页面是soup = BeautifulSoup(url,'html.parser')不工作，因为有多个具有相同类名的div标记。编辑： def sitek

浏览 4提问于2017-04-23得票数 1

回答已采纳

3回答

Excel VBA抓取具有相同类名的li标记

、、、

我正在尝试抓取共享相同类名的li标记，HTML代码如下所示：<ul class="top-section-list" data-selenium="highlightList"><li class="top-section-list-item">sample text# 5</li> 下面是我的VBA代码，它只能<

浏览 7提问于2017-12-04得票数 2

3回答

具有不同类名的BeautifulSoup* - find_all div标记*

、

我想选择所有的<div>，其中类名为post has-profile bg2或post has-profile bg1，而不是最后一个，即panel<div id="7" class="post has-profile bg1"> some text 2 </div> <div id="8" class="post ha

浏览 0提问于2018-07-30得票数 2

回答已采纳

2回答

在BeautifulSoup中对特定类进行过滤

、、、、

我用BeautifulSoup做了这样的事情：当我使用这个过滤器时，我的理解是我将得到所有带有属性或类名name的name标记。但是，我不希望div标记的每个实例都具有属性name。我想要某些实例，其中它们定位在HTML文件的某个子树中。更具体地说，标记<u1 class

浏览 8提问于2017-08-15得票数 0

回答已采纳

3回答

使用BeautifulSoup抓取-使用相同类名的问题

、、

我的目标是获得以下列的单独列表: close、open、volume和date。我的问题是，对于volume、open和close列，类名(text-center)是相同的(例如第一行)： <th scope="row" class="font-semibold text-center></td>N/A </td&g

浏览 61提问于2021-11-21得票数 2

回答已采纳

1回答

使用BeautifulSoup* .find()进行网络抓取总是不返回*

、、

DOM的相关部分：from bs4 import BeautifulSouppage = requests.get(URL) soup = BeautifulSoup(page.content, 'html.parser

浏览 4提问于2022-05-29得票数 -1

1回答

具有相同类的多个元素

、、、

在我正在抓取的网站上，有2个具有相同类('ul', class_='list')的元素。当我运行时： syn = soup.find('ul', class_='list') print(syn.text) 我只获得了类('ul', class_='list')的第一个元素的文本如何才能获得具有相同类名</

浏览 23提问于2020-10-01得票数 0

回答已采纳

2回答

无法从python中的html页面提取文本

、、

我对网络抓取非常陌生。我读到了关于BeautifulSoup的文章，并试图使用它。但我无法提取具有给定类名“company-desc-and-排序容器”的文本。我甚至不能从html页面中提取标题。这是我尝试过的代码：import requests url= 'http://fortune.com/best-com

浏览 5提问于2016-12-20得票数 1

回答已采纳

1回答

Python bs4不从元素返回文本

、、

我正在尝试抓取reverb.com以获取不同乐器的名称。我找到了保存仪器名称文本的元素，但由于某种原因，标记返回为空。我将在下面提供我的代码。对于为什么会发生这种情况，有什么想法吗？import requests url = 'https://reverb.com/marketplace?我检查过了，它们似乎都有具有相同类的</

浏览 9提问于2021-02-18得票数 0

2回答

如何从java脚本中刮取经度

、、、

我对BeautifulSoup4相当陌生，在从javascript中提取纬度和经度值时遇到了困难。文件很长，我必须准备所有纬度的数据帧。Java脚本文件将具有如下字符串：这里的标记i

浏览 3提问于2020-07-16得票数 1

回答已采纳

1回答

查找具有相同类名的多个表，Python webscraping

、

我正在尝试使用Python4和BeautifulSoup抓取具有相同类名的多个表。from bs4 import BeautifulSoupstandingsPage = requests.get(standingsURL) standingsSoup

浏览 7提问于2020-04-25得票数 0

1回答

通过facebook营销api获取facebook的最新广告类型及其需求

、、、、

我一直在看上的facebook api文档，但还没有找到解决方案。我只是想得到facebook的最新广告类型的列表，这些类型列在这个页面上：以及每种广告的规格。是否可以通过API实现？我只是想澄清一下，我不想访问某个特定facebook账户的广告或活动。我只想通过API动态获取facebook的最新广告类型和每种广告类型的要求，而不必将这些信息存储在我的数据库中，以避免手动保持最新信息。我意识到这不是一个特定的编码问题，但如果可以的话

浏览 25提问于2020-10-28得票数 2

1回答

.findall()在BeautifulSoup中没有返回所有"tr“标记

、、

我不明白为什么.find_all()没有返回我搜索的所有标记。基本上，我试图抓取并获取所有"tr“标记的列表(主要是对标记中的标记感兴趣)，但它只返回嵌套在标记中的第一个"tr”标记，并且我假设它永远不会到达。最终目标:我只需要从表体的每一行中提取酒名。def web_parser1(): from bs

浏览 6提问于2022-04-06得票数 0

回答已采纳

2回答

如何使用BeautifulSoup获取带有类的div的内容？

、

如何使用web抓取类获取div的内容？import re br = mechanize.BrowserTrue)

浏览 5提问于2015-04-08得票数 1

回答已采纳

1回答

使用Scrapy获取具有相同类名的多个元素的列表

、

有一个我想要抓取的网站，它有许多具有相同类名的div。例如，假设这个类名是article-container，站点中有12个div包含这个类名。解决这个问题的最佳方法是什么？

浏览 3提问于2019-12-12得票数 1

2回答

Python - Beautifulsoup循环使用相同类名的div标记

、、、、

我想知道如何从一个网站上删除信息，其中有多个元素具有相同的标识符，我希望从这些标识符中删除价格数据。我遇到的问题是，当我循环遍历每个div和print()时，我会在控制台中多次看到它的粘贴。我假设这是du div，我正在定位具有相同标记+类名的封装多个元素。£859.99£1,049.99£829.99£899.99£999.95£999.95 £999.95

浏览 2提问于2022-06-13得票数 -1

2回答

从python中的span标记获取类名

、

我对数据抓取很陌生，我正在使用BeautifulSoup从网页中获取一些数据。我正在尝试在span标记中获取r100。我知道r100是类名，但是这个数据是必需的。有可能吗？我的代码print(st2)<span class="rating r100"></span>

浏览 3提问于2021-04-04得票数 0

回答已采纳

1回答

无法使用BeautifulSoup抓取HTML标记，引发NoneType

、、、

我在这里有这个脚本，它可以抓取一些超文本标记语言：for i inhtmlbs: p

浏览 0提问于2020-11-12得票数 0

点击加载更多