BeautifulSoup从一个类中提取多个元素_BeautifulSoup分解一个元素的多个类_使用BeautifulSoup提取元素中的文本 - 腾讯云开发者社区

beautifulsoup

我一直在尝试从网站上抓取图片的链接，但我只设法获得了第一个链接。代码： from bs4 import BeautifulSoup source = requests.get(link).text imglist = soup.find_all('div', class_='container-chapter-reader

浏览 34提问于2021-05-03得票数 2

回答已采纳

1回答

如何使用BeautifulSoup抓取Instagram

python、web-scraping、beautifulsoup、instagram、python-requests

我想从一个公开的Instagram账户上抓取照片。我对bs4非常熟悉，所以我就从这个开始。使用Chrome上的元素检查器，我注意到图片在无序列表中，李有类“照片”，所以我想，到底什么--不可能很难与findAll擦肩而过，对吧？错误:它不返回任何东西(下面的代码)，我很快就注意到，，元素检查器中显示的代码和我从请求中提取的代码，与我从请求中提取的代码中的 AKA无序列表不同。知道怎样才能得到元素检

浏览 3提问于2013-08-08得票数 12

回答已采纳

2回答

如何将两个不同的元素追加到列表中

python、list、beautifulsoup

我使用beautifulsoup从url页面提取href链接，然后将url名称和提取的链接附加到列表中以创建列表。例如，对于每个url，我希望访问页面并提取链接中的url，然后将其附加到列表中的列表以创建： [['www.example.com', 'www.example.com/extractedlink1',我遇到问题的部分是在列表中追加列表中的两个元素

浏览 6提问于2017-02-06得票数 0

回答已采纳

2回答

试图查找没有特定类的所有<a>元素

python、web-scraping、beautifulsoup

我第一次尝试网络抓取，我正在使用BeautifulSoup从一个网站收集一些信息。我试图得到所有的元素，这些元素有一个类，而不是另一个类。例如：<a class="something">Information I want</a> <a cla

浏览 0提问于2021-04-04得票数 0

回答已采纳

1回答

巨蟒和美丽的汤，捡起所有的元素

python、elements

在python和BeatifulSoup的帮助下，我从一个网站得到了一篇文字文章。现在我有个奇怪的问题..。我只是在多个p标记中打印出文本，这些标记位于带有类dr_article的div中。= tag.find_all("p").text但是，当我在[0]之前选择.text的第一个<e

浏览 5提问于2013-08-01得票数 5

回答已采纳

2回答

BeautifulSoup不会从网页中提取所有表单

python、html、forms、web-scraping、beautifulsoup

我希望从一个给定的网站使用Python3和BeautifulSoup提取所有表单。下面是一个执行此操作的示例，但无法提取所有表单：from bs4 import BeautifulSoup data = urlopen(url) parser =

浏览 0提问于2017-03-27得票数 2

3回答

在python中使用re.sub()替换html代码

python、regex、str-replace

例如：在这种情况下，我试图在我的表中添加边框。

浏览 5提问于2014-12-22得票数 0

回答已采纳

1回答

当元素存在于浏览器中时，漂亮的soup返回none

python、web-scraping、beautifulsoup

我已经看过之前的答案，但似乎没有一个是适用的。我正在构建一个开源的quizlet抓取器，用于从一个类(例如)中提取所有链接。在本例中，标签是a，类是"UILink“。但是当我使用下面的代码时，返回的列表并不包含我要查找的元素。是因为描述的JavaScript问题吗如何抓取这些urls？import requests from bs4 import B

浏览 0提问于2020-10-18得票数 0

2回答

使用Python从HTML中提取带有父标记类型的文本

python、html-parsing

我希望从一些HTML中提取文本和元素类型。some text'}, {'tag':'h1', 'text':'some header'}, {'tag':'div', 'text':'some more text'}] 我如何通过HTML解析来提取这些信息我尝试过使用BeautifulSoup并能够提取HTML中

浏览 1提问于2022-04-20得票数 -1

回答已采纳

1回答

使用beautifulSoup在没有类的情况下从标记中抓取

python、web-scraping、beautifulsoup

如果我想从锚标签中的href属性和字符串“水平零黎明”中抓取链接。我能用beautifulSoup做些什么来刮掉我需要的数据？

浏览 1提问于2017-05-26得票数 1

回答已采纳

2回答

BeautifulSoup - lxml和html5lib解析器之间的差异

python、web-scraping、beautifulsoup、lxml、html5lib

我使用的是BeautifulSoup 4和Python2.7。我想从一个网站中提取某些元素(数量，见下面的例子)。由于某些原因，lxml解析器不允许我从页面中提取所有想要的元素。它只打印前三个元素。我正在尝试使用html5lib解析器来查看是否可以提取所有这些解析器。from bs4 impor

浏览 1提问于2014-03-27得票数 7

2回答

如何提取嵌套在多个划分元素中的锚元素

python、html、web-scraping、beautifulsoup、css-selectors

我试图用一个公共的类attr从我漂亮的soup对象中提取锚元素，每个类都嵌套在多个分区中。这些划分是重复的，并用一些脚本分隔我尝试利用锚元素中的公共类属性来提取它们。import requests, bs4, webbrowser webpage.raise_for_status() soup=bs4.Beautiful

浏览 22提问于2019-05-27得票数 2

回答已采纳

1回答

难刮web表-多个嵌套类

python-3.x、web-scraping、beautifulsoup、html-table

我试图从一个网站刮表，但不确定是否能够正确地引用适当的类。我附上截图和从BeautifulSoup提取的身体。我是不是看错了，请原谅，我对网络刮擦很陌生。我需要提取圆圈高亮部分中存在的表格，但是不确定如何在那里遍历。

浏览 6提问于2022-08-23得票数 0

回答已采纳

0回答

选择带有多个css的html标签

beautifulsoup

我使用BeautifulSoup从html中提取标签。有一些具有多个css类的html标签示例： <a class ='a-link-normal s-access-detail-page s-color-twister-title-link='s-access-detail-page s-color-twister-title-link a-text-normal'>Div text</div&

浏览 9提问于2018-07-18得票数 0

3回答

BeautifulSoup -没有类的刮表

python、python-3.x、web-scraping、beautifulsoup

我被困在一个项目，需要我刮一个桌子从一个网站。我遇到的问题是网页上有多个表，当我检查元素时，它们似乎都没有类。然而，表行和列确实有分配给它们的类。from bs4 import BeautifulSoup income_url = "http://zipatlas.com/us/pa/philadelphia/zip-code-co

浏览 11提问于2020-04-13得票数 1

回答已采纳

1回答

beautifulsoup4从具有特定属性值的锚点元素获取href

python、parsing、beautifulsoup

我正在尝试解析来自页面上多个锚点元素的href值，这些锚点元素的属性为itemprop，值为url，使用BeautifulSoup4 例如，从<a itemprop="url" href="/pages/page"></a>中提取/pages/page，但是在一个页面中有多个这样的项目，所以我希望将它们放在一个数组中。

浏览 2提问于2016-10-28得票数 1

1回答

BeautifulSoup -多个表

beautifulsoup

我怀疑如何从一个html页面中提取多个表。我们有两种类型的表，我只想将具有相同样式的表(包含很多列的表)导入到dataframe中。from bs4 import BeautifulSoup html = respons

浏览 4提问于2021-12-11得票数 -2

1回答

如何提取特定元素后面的所有类"a“？

python-3.x、beautifulsoup

我正在尝试提取一个类中的所有元素a，这个类的文本是Full browser with import requestssoup = BeautifulSoup(requests.get(url).content, '

浏览 15提问于2020-08-25得票数 0

回答已采纳

3回答

所有html中没有被请求和BeautifulSoup提取的元素

python、web-scraping、beautifulsoup、html-parsing

我正试图从一个显示来自不同代理机构的当前赔率的网站上获取关于市场竞争影响的分配赔率。我正在使用请求和BeautifulSoup提取相关数据。然而，在使用之后：from bs4 import BeautifulSoup url = "https://www.bestodds.com.au/odds/cricketICC-World-Twenty20/Sri-Lanka-v-Afghanistan_71992&#x

浏览 3提问于2016-03-17得票数 0

回答已采纳

3回答

使用Python Selenium性能进行Web抓取

python、performance、selenium、web-scraping、beautifulsoup

我认为不同之处在于浏览器加载元素所需的时间，但它肯定不止如此。一旦浏览器加载页面(5秒)，我所要做的就是从一个表中提取一些<tr>标记。大约花了3-4分钟才提取出1016条记录，在我看来这是非常缓慢的。我得出的结论是，用于查找元素(如find_elements_by_name )的webdriver很慢。要比find方法在BeautifulSoup中慢得多？如果我从webdriver获得整个html，然后用lxml解析它并使用Bea

浏览 0提问于2019-09-14得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云