Python selenium web在没有类名的嵌套跨度中抓取动态内容

Python Selenium Web是一个用于自动化浏览器操作的工具，可以模拟用户在浏览器中的操作，例如点击、输入、提交表单等。它基于Python语言开发，可以与各种主流浏览器进行交互，包括Chrome、Firefox、Safari等。

在没有类名的嵌套跨度中抓取动态内容时，可以使用Selenium提供的其他定位方式来定位元素，例如通过XPath、CSS选择器、ID等来定位元素。以下是一些常用的定位方式：

XPath定位：XPath是一种用于在XML文档中定位元素的语言，可以通过元素的层级关系、属性等来定位元素。可以使用绝对路径或相对路径来定位元素。示例代码如下：

from selenium import webdriver

driver = webdriver.Chrome()
driver.get("https://example.com")

# 使用XPath定位元素
element = driver.find_element_by_xpath("//div[@id='content']//a[@class='link']")

CSS选择器定位：CSS选择器是一种用于选择HTML元素的语法，可以通过元素的标签名、类名、ID等来定位元素。示例代码如下：

from selenium import webdriver

driver = webdriver.Chrome()
driver.get("https://example.com")

# 使用CSS选择器定位元素
element = driver.find_element_by_css_selector("div#content a.link")

ID定位：如果元素具有唯一的ID属性，可以直接使用ID来定位元素。示例代码如下：

from selenium import webdriver

driver = webdriver.Chrome()
driver.get("https://example.com")

# 使用ID定位元素
element = driver.find_element_by_id("element_id")

其他定位方式：Selenium还提供了其他一些定位方式，如通过链接文本、标签名、名称、标签属性等来定位元素。具体可以参考Selenium的官方文档。

在抓取动态内容时，可以使用Selenium的等待机制来等待页面加载完成或元素出现。例如，可以使用WebDriverWait类来等待元素可见、存在、可点击等条件。示例代码如下：

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

driver = webdriver.Chrome()
driver.get("https://example.com")

# 等待元素可见
element = WebDriverWait(driver, 10).until(
    EC.visibility_of_element_located((By.XPATH, "//div[@id='content']//a[@class='link']"))
)

关于Python Selenium Web的更多信息和用法，可以参考腾讯云的相关产品和文档：

腾讯云产品：云测、云测自动化测试、云测移动测试
文档：Python Selenium Web文档

Python selenium web在没有类名的嵌套跨度中抓取动态内容

python、selenium、selenium-webdriver、web-scraping

我试图解析出嵌套span结构中的动态内容。我想要获取的文本是"dynamic content2“，它是第二个span元素的内容(class = "second span")，它的值正在定期更新。<span class="second span"> &

浏览 8提问于2021-09-30得票数 0

回答已采纳

1回答

如何使用Python使用Selenium在跨内的标签中获取文本？

python、selenium、xpath、css-selectors、webdriverwait

我想在网站上使用Selenium (与Python一起使用)的代码块(用于web抓取)如下所示- <span class="uppr_sec">="lwr_sec"> <label>Hosted By Some Random Person</label>

浏览 1提问于2021-01-04得票数 1

回答已采纳

3回答

从Morningstar网站抓取财务数据

python、json、beautifulsoup

我正在尝试从下面的morningstar网站上获取数据：我现在遇到的问题不同于我抓取的简单网页，程序似乎找不到任何表格，即使我可以在</em

浏览 3提问于2016-02-27得票数 3

1回答

基于动态内容和隐藏数据表的Selenium* Web抓取*

python、selenium、dynamic、web-scraping、beautifulsoup

真的需要这个社区的帮助！html=browser.execute_script('return document.body.innerHTML') sel_soup=BeautifulSoup(html, 'html.par

浏览 15提问于2018-02-14得票数 2

2回答

BeautifulSoup web抓取，无结果

python、beautifulsoup、web-crawler

我在试着从https://hk.appledaily.com/search/apple..。我需要从div class="flex-feature"但它只返回[]..。希望大家能帮忙，谢谢！

浏览 40提问于2020-10-06得票数 2

回答已采纳

1回答

Selenium的WebDriver.execute_script()返回'None‘

selenium、selenium-webdriver

我的程序在使用Selenium从网页中获取现有类时遇到了问题。我的WebDriver.execute_script函数似乎不起作用。import urllibpath_to_chromedriverof 'None'...so obviously it isn't fi

浏览 5提问于2014-11-25得票数 3

回答已采纳

2回答

使用重复类在Selenium* + Python中查找元素*

python、selenium、web-scraping、selenium-chromedriver

我正在使用Selenium + Python在Battlefy页面上抓取匹配结果，以便稍后操作并进入数据库。我正在尝试使用Selenium抓取团队的名称和结果，因为动态加载JS需要我使用无头浏览器。但是，我尝试使用类名获取每个大学的文本，但是使用Selenium的find_elements_by_class_name方法似乎行不通。driver.find_elem

浏览 0提问于2020-02-15得票数 2

2回答

在web服务器上使用java内容的抓取

python、scrapy、web-crawler

我想从一个显然使用javascript生成表的站点(这个站点是oddsportal.com)中抓取内容。我看到Scrapy无法加载动态内容，我阅读selenium可以处理它，但我计划使用web服务器。有什么方法可以解析这个站点或获取动态请求并使用scrapy解析它吗？例如，我想从这个页面导入完整的表，包括标题、匹配名和赔率。

浏览 3提问于2016-01-28得票数 1

回答已采纳

2回答

在Selenium中使用find_element_by_class_name迭代多个类

python、selenium、webdriver、web-scraping

我正在使用Python中的Selenium进行web抓取项目。*Compound class names not permitted *如何迭代具有相同css类名的所有表？谢谢

浏览 5提问于2011-11-27得票数 3

回答已采纳

1回答

Python和Selenium: Webscraping

python、selenium-chromedriver

我对使用selenium和python进行web抓取是个新手。我试图从其中抓取数据的网页在特定的nav类中有href元素。我需要在EXAMPLE3中单击，但我找不到类名或id。

浏览 13提问于2021-09-24得票数 0

回答已采纳

4回答

Selenium Web抓取没有ids或类名的嵌套div

python、selenium、xpath、css-selectors、webdriverwait

我正在尝试使用selenium从嵌套的HTML表中获取产品名称和数量。我的问题是有些div没有任何id或类名。我要访问的表是关键产品列表。这是我所做的，但我似乎对如何获得嵌套的div感到迷惑不解。该网站在代码中。the href and then get to the left and right classes to get title and quantity

浏览 5提问于2020-09-02得票数 0

1回答

从html页面不显示数据的url读取数据

beautifulsoup、python-3.5

r = s.get(link) print(soup.prettify()) 但是我看不到网页的内容

浏览 1提问于2020-02-05得票数 0

2回答

Selenium.common.exceptions.NoSuchElementException错误即使有显式等待

python、selenium、web-scraping

我目前正在尝试从subreddit中抓取数据(我使用的是旧的reddit ->扩展名，它以这种方式恢复了reddit的旧外观，这样更容易抓取)，但是每当我试图获得结果时，我都会从这段代码中得到错误：，我是怎么解决这

浏览 0提问于2021-02-06得票数 0

回答已采纳

3回答

“美丽的汤”查找()并不能找到类的所有结果

python、html、web-scraping、beautifulsoup

我有代码试图在tracklist容器中提取所有html内容，它应该有88首歌曲。信息肯定在那里(我打印了汤以检查)，所以我不知道为什么前30 react-contextmenu-wrapper之后的所有东西都丢失了。= BeautifulSoup(html, "html5lib") print(main)

浏览 6提问于2019-10-05得票数 1

回答已采纳

1回答

Python Selenium div隐藏在inspect中，无法在实际页面上看到显示div的按钮

python、html

我正在使用Selenium (链接在这里https://www.hltv.org/stats/players)用Python语言编写一个web抓取脚本，我想要抓取每个播放器的所有链接。它显示了许多播放器，但不是所有的，我看不到在实际页面上显示这些元素的按钮，它们隐藏在页面后面。如果我检查页面，有一个表格显示了一些在页面上可以看到的内容，那么在

浏览 9提问于2020-12-06得票数 0

回答已采纳

1回答

用Selenium抓取Instagram点赞

python、python-3.x、selenium、web-scraping、instagram

我正在尝试用Python和Selenium从instagram上抓取点赞信息。我有以下情况： ? 我想刮掉"63“这个数字。我有以下源代码(带有inspect)。 ? 我多次尝试用selenium抓取数字"63“：按类名、按xpath…… 例如： Likes=browser.find_element_by_xpath("xpath").text 在本例中，我得到的

浏览 8提问于2020-04-19得票数 0

3回答

在Python中使用java脚本抓取网页

javascript、python、python-3.x、web-scraping

我在windows机器上使用python 3.2 (newb) (虽然如果需要的话，我在虚拟机器上有ubuntu 10.04，但我更喜欢在windows机器上工作)。基本上，我可以使用http模块和urlib模块来抓取web页面，但只有那些没有java脚本document.write("<div....")的页面才能运行。当我获得实际的页面时，它会添加不存在的数据(意思是没有</em

浏览 3提问于2011-03-17得票数 0

回答已采纳

3回答

scrapy能像Selenium一样控制和显示浏览器吗？

python、selenium、scrapy

当我使用Selenium时，我可以看到浏览器GUI，是否可以使用scrapy或严格基于scrapy命令行？

浏览 4提问于2015-11-03得票数 1

回答已采纳

1回答

使用Selenium键入Instagram搜索栏

python、selenium、selenium-webdriver、css-selectors、instagram

我试图在python中使用selenium web驱动程序选择一个搜索栏。问题是类名和许多css值是动态生成的。选择搜索栏提交搜索的最佳方法是什么？ 

浏览 4提问于2016-04-26得票数 1

回答已采纳

1回答

脚本无法从网页获取数据

python、html、web-scraping、python-requests、lxml

我正在尝试用Python编写一个程序，它可以获取股票的名称及其价格并打印出来。但是，当我运行它时，什么也没有打印出来。似乎从网站获取数据时出现了问题。我仔细检查了网页的路径是否正确，但由于某些原因，文本不想显示。print ('Prices:' , Prices) here is the website I am trying to get the data from 我试过BeautifulSoup，但它也有同样的问题

浏览 22提问于2019-01-04得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

Python selenium web在没有类名的嵌套跨度中抓取动态内容

相关·内容

Python selenium web在没有类名的嵌套跨度中抓取动态内容

如何使用Python使用Selenium在跨内的标签中获取文本？

从Morningstar网站抓取财务数据

基于动态内容和隐藏数据表的Selenium* Web抓取*

BeautifulSoup web抓取，无结果

Selenium的WebDriver.execute_script()返回'None‘

使用重复类在Selenium* + Python中查找元素*

在web服务器上使用java内容的抓取

在Selenium中使用find_element_by_class_name迭代多个类

Python和Selenium: Webscraping

Selenium Web抓取没有ids或类名的嵌套div

从html页面不显示数据的url读取数据

Selenium.common.exceptions.NoSuchElementException错误即使有显式等待

“美丽的汤”查找()并不能找到类的所有结果

Python Selenium div隐藏在inspect中，无法在实际页面上看到显示div的按钮

用Selenium抓取Instagram点赞

在Python中使用java脚本抓取网页

scrapy能像Selenium一样控制和显示浏览器吗？

使用Selenium键入Instagram搜索栏

脚本无法从网页获取数据

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐