如何在没有Python语言find_all函数硬编码索引的情况下，从美汤中的同一个类和属性中抓取多个信息？

在没有Python语言find_all函数硬编码索引的情况下，从美汤中的同一个类和属性中抓取多个信息，可以使用以下方法：

使用CSS选择器：BeautifulSoup库支持使用CSS选择器来定位元素。可以使用.select()方法来选择具有相同类和属性的多个元素。例如，如果要从美汤中的所有<div>元素中抓取信息，可以使用以下代码：

soup.select('div.classname')

其中，div.classname是CSS选择器，表示选择所有类名为classname的<div>元素。

使用正则表达式：如果无法使用CSS选择器来定位元素，可以使用正则表达式来匹配需要的信息。可以使用re模块中的findall()方法来查找所有匹配的内容。例如，如果要从美汤中的所有<a>标签中抓取链接，可以使用以下代码：

import re

links = soup.find_all('a', href=re.compile('.*'))

其中，re.compile('.*')是一个正则表达式，表示匹配所有的链接。

使用父子关系：如果无法使用CSS选择器或正则表达式来定位元素，可以通过父子关系来获取信息。可以先定位到包含所有信息的父元素，然后再从父元素中提取需要的信息。例如，如果要从美汤中的一个<div>元素中抓取多个信息，可以使用以下代码：

div = soup.find('div', class_='classname')
info1 = div.find('span', class_='info1').text
info2 = div.find('span', class_='info2').text

其中，div.find('span', class_='info1')表示在<div>元素中查找类名为info1的<span>元素，.text表示获取元素的文本内容。

以上是在没有Python语言find_all函数硬编码索引的情况下，从美汤中的同一个类和属性中抓取多个信息的方法。希望对您有帮助！

页面内容是否对你有帮助？

有帮助

没帮助

数组在css中用于多个ID

css、arrays

这有可能为CSS创建一个数组吗？ <style> #info1, #info2, #info3, #info4 { display: none; } </style> 假设我有20个隐藏的div，由id="info1“、id="info2”识别了20次。但我不想在我的风格中声明#info2 1，#info2 2，.#info2 20。这可以用数组或其他方法来完成吗？

浏览 1提问于2014-03-10得票数 1

回答已采纳

2回答

在beautifulsoup4中解析与html标记相同级别的文本

python、python-3.x、beautifulsoup

我有这段html，我想解析： <div class="class123"> <div><strong>title123</strong> <span style="something123">something else</span> </div> I want to parse this, how can do that? </div> 我怎么才能用漂亮的汤来解析呢？我知道如何解析标签中的东西，但是如何在相同的层次上解析一些东西呢？ soup1

浏览 4提问于2016-12-01得票数 1

回答已采纳

2回答

接受单词开头的漂亮汤find.all()

python、beautifulsoup

我正在抓取一个网站，里面有一个漂亮的汤，它的类名如下： <a class="Component-headline-0-2-109" data-key="card-headline" href="/article/politics-senate-elections-legislation-coronavirus-pandemic-bills-f100b3a3b4498a75d6ce522dc09056b0"> 主要的问题是类名总是以Component-headline-开头，而只是发送一个随机数。当我使用美丽汤的soup.find_a

浏览 29提问于2020-12-18得票数 0

回答已采纳

2回答

使用BeautifulSoup时的网络抓取问题

python、web、web-scraping

我是Python web抓取的新手，我正在抓取productreview.com进行复习。下面的代码提取了我一次审查所需的所有数据： #Scrape TrustPilot for User Reviews (Rating, Comments) import pandas as pd import numpy as np from bs4 import BeautifulSoup as bs import json import requests import datetime as dt final_list=[] url = 'https://www.productreview.c

浏览 11提问于2020-07-18得票数 0

2回答

用优美汤从span中获取图像数据源

python、beautifulsoup

我试图从a类中的span中提取"data-img-url“值。但我不会成功的。 <div class="td-module-container td-category-pos-image"> <div class="td-image-container"> <a href="https://www.jornalnoticias.co.mz/category/ciencia-e-ambiente/" class="td-post-category">Ciência, Te

浏览 3提问于2021-12-28得票数 0

1回答

BeautifulSoup find类包含一些特定的单词

web-scraping、beautifulsoup

我到处寻找如何找到一个名称包含一些单词的类，但我没有找到它。我想从带有单词脚注的类中获取信息。 <div class="footerinfo"> <span class="footerinfo__header"> </span> </div> <div class="footer"> <div class="w-container container-footer"> </div> </div>

浏览 26提问于2019-02-21得票数 1

回答已采纳

1回答

python bs4分析器类中的错误？

python、regex、beautifulsoup

#!/usr/bin/env python # -*- coding: utf-8 -*- from bs4 import BeautifulSoup import re doc = "<div>Text text <span class='_ _3'>empty</span> text</div>" soup = BeautifulSoup(doc) for span in soup.find_all('span' , class_=re.compile("_\s_[0-9]+"

浏览 4提问于2014-01-08得票数 2

回答已采纳

3回答

BeautifulSoup/Python中contains()选择器的查询

jquery、python、web-scraping、beautifulsoup

使用jQuery选择器，您可以选择包含innerText "John“和$("div:contains('John')")的div，这样您就可以在以下文件中匹配第二个<div>： <div>Bill</div> <div>John</div> <div>Joe</div> 我如何在Python的“美丽汤”或其他Python模块中做到这一点？我刚看到提到你可以在lxml中使用CSS选择器。我一定要用这个吗，还是有办法和汤一起吃？背景:要求解析被刮过的网页。

浏览 5提问于2011-12-20得票数 1

回答已采纳

1回答

可单击切换以悬停、停留和改进代码

jquery、html、css

我对jQuery非常陌生，我正在构建一个带有多个切换div的页面。在我到目前为止的例子中，我有3个可点击的div (.info1、.info2、.info3)，它们分别切换其他相应的div (.infobox1、.infobox2、.infobox3)。它们目前是可点击的，因为在信息框中，我想要点击链接，我不知道如何使信息框在一两秒钟内保持可见，所以您有时间在信息框div上悬停，而不让它消失。所以我有两个问题：我怎样才能使我的代码，使我不必继续增加行切换每次，$('.infobox1').toggle();$('.infobox2').toggle(

浏览 0提问于2015-02-18得票数 0

2回答

使用BeutifulSoups find()，但让pythons ()代替

python、beautifulsoup

我正在学习网络抓取，我遇到了一个问题。我正在尝试使用内置于BS4中的BS4()方法，但它将代码看作是.find()中构建的Pythons 我不知道怎么解决它。我尝试过使用.soup.find()，但它似乎也没有修复它。这是我的代码，我得到了第9行和第10行的错误 from bs4 import BeautifulSoup import requests html_text = requests.get('https://www.diyelectronics.co.za/store/353-printers') soup = BeautifulSoup(html_text.t

浏览 6提问于2021-12-09得票数 0

回答已采纳

1回答

使用Beautiful Soup和Requests提取数据

python、beautifulsoup、python-requests

我正在尝试使用Beautiful soup和requests包从堆栈溢出中抓取数据。我已经能够提取大部分细节，但是当我尝试提取用户的信誉得分时，我只能提取reputation score和Gold的数据，而不能提取Silver和Bronze计数的数据。下面是我用来提取的代码： from bs4 import BeautifulSoup import requests source = requests.get('https://stackoverflow.com/questions/53968946/how-can-i-limit-function-slot-play-just-

浏览 21提问于2018-12-30得票数 1

回答已采纳

2回答

Javascript:以数组形式获取所有表单输入值

javascript、html、forms

我正在尝试让NumberBox的onEnter()函数能够动态更改formBox。如果有人输入3作为输入值，我需要它显示3个表单和确切的输入框。我知道如何从输入框中获取值，并在下面显示表单的数量。我的问题是我不知道如何让一个提交按钮将所有的值存储到一个数组中，比如[1,1,1,1,1,2,2,2,2,2，等等]。一旦我弄清楚了这一点，我应该能够自己输出这些值。最终目标是使用这些值在另一个页面上多次显示列表。我更喜欢将其完全保留在Javascript中。我相信这是可以做到的，但我遇到了困难，需要一些帮助。 function clickMe() { var input1 = docu

浏览 31提问于2019-11-10得票数 0

回答已采纳

3回答

如何在find_all中使用find()和BeautifulSoup ()？

python、web-scraping、beautifulsoup

我目前正在做一些网络抓取。我有一个HTML： <meta property="og:price:amount" content="1.89"/> <meta property="og:price:standard_amount" content="6.31"/> <meta property="og:price:currency" content="USD"/> 我用的是漂亮的汤(Python)。我想要提取的信息是1.89和6.31 (产品价格)。这是我的密码

浏览 4提问于2019-12-17得票数 4

回答已采纳

1回答

如何计算使用漂亮汤检索的代码行数？

python、printing、count、beautifulsoup

在美丽的汤中有什么功能来计算检索到的行数吗？或者还有其他的方法可以做到吗？ from bs4 import BeautifulSoup import string content = open("webpage.html","r") soup = BeautifulSoup(content) divTag = soup.find_all("div", {"class":"classname"}) for tag in divTag: ulTags = tag.find_all("ul", {"

浏览 0提问于2015-05-15得票数 3

回答已采纳

1回答

即使解析器提取了特定标记，也无法在html中找到它。

python、html、web-scraping、tags

我正在尝试使用python从其中一个网站抓取数据。我正在尝试获取一些数据，即使脚本正在获取指定的HTML标记--它无法在其中找到某些标记。不知道会有什么问题。这是代码 soup = bs(driver.page_source, 'lxml') rows = soup.find('div', id='widgetContent').find_all('div', recursive=False) for row in rows: price = row.find('span', class_=&#

浏览 4提问于2020-06-05得票数 0

1回答

使用beatifoulsoup访问第二个标签

python

我开始做一些网站抓取项目，我遇到了在同一个父标签中选择第二个标签的困难。我试过用谷歌，但我还是不明白它的意思。我的代码如下所示： url = 'url to site' content = requests.get(url).text soup = BeautifulSoup(content, 'lxml') car_add = soup.find('div', class_='offer-wrapper') ad_title = car_add.find('h3', class_='lheight

浏览 49提问于2020-01-11得票数 0

回答已采纳

1回答

试着擦伤一段距离

python、html、beautifulsoup、screen-scraping

我一直在尝试使用Python中的漂亮汤从网站上抓取两个值，这给我带来了麻烦。以下是我正在抓取的页面的网址：下面是我想要刮掉的值：我试过： from bs4 import BeautifulSoup import requests source = requests.get('https://www.stjosephpartners.com/Home/Index').text soup = BeautifulSoup(source, 'lxml') gold_spot_shell = soup.find('div', class_ =

浏览 3提问于2020-09-04得票数 0

回答已采纳

1回答

从内部类中抓取

python-2.7、lxml

我想从Merriam Webster Dictionary中抓取定义。例如。这是我想要抓取的代码片段。 <div class="definition-block def-text"> <ul class="definition-list no-count"> <li> <p class="definition-inner-item"> <span><span c

浏览 1提问于2016-02-26得票数 1

2回答

jQuery对话框总是显示在滚动条的顶部

javascript、jquery、html、css、dialog

我在jQuery答案的帮助下创建了一个包含不同内容选项卡的对话框-> 他为我想要实现的目标提供了一个很好的解决方案。 $(document).ready(function() { $('li:first-child, #i1').click(function() { $('#main button').css({ 'display': 'inline-block' }); $('#i1').addClass("active"); $(

浏览 4提问于2017-01-31得票数 0

回答已采纳

2回答

如何使用python抓取器在标记类中搜索文本

python、web-scraping

我正尝试在python scraper中的标记类中搜索文本。例如，我正在尝试搜索这个标记： <span class="story-author">By Staff</span> 通过在我的find函数中只搜索“作者”， text = soup.find(class_='author') print(text) 但是，它没有找到此标记，因此不打印任何标记。我有任何方法可以解决这个问题

浏览 15提问于2019-08-28得票数 1

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

如何在没有Python语言find_all函数硬编码索引的情况下，从美汤中的同一个类和属性中抓取多个信息？

相关·内容

数组在css中用于多个ID

在beautifulsoup4中解析与html标记相同级别的文本

接受单词开头的漂亮汤find.all()

使用BeautifulSoup时的网络抓取问题

用优美汤从span中获取图像数据源

BeautifulSoup find类包含一些特定的单词

python bs4分析器类中的错误？

BeautifulSoup/Python中contains()选择器的查询

可单击切换以悬停、停留和改进代码

使用BeutifulSoups find()，但让pythons ()代替

使用Beautiful Soup和Requests提取数据

Javascript:以数组形式获取所有表单输入值

如何在find_all中使用find()和BeautifulSoup ()？

如何计算使用漂亮汤检索的代码行数？

即使解析器提取了特定标记，也无法在html中找到它。

使用beatifoulsoup访问第二个标签

试着擦伤一段距离

从内部类中抓取

jQuery对话框总是显示在滚动条的顶部

如何使用python抓取器在标记类中搜索文本

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐