Python Seleinum查找特定类的div，如果另一个div位于其中，则找到第三个div并复制其中的文本

Python Selenium是一个用于自动化浏览器操作的工具，可以用于爬虫、自动化测试等场景。在查找特定类的div元素时，可以使用Selenium提供的定位方法来实现。

首先，需要导入Selenium库和相关的模块：

from selenium import webdriver
from selenium.webdriver.common.by import By

接下来，创建一个WebDriver实例，启动浏览器：

driver = webdriver.Chrome()  # 使用Chrome浏览器，需要下载对应的ChromeDriver并配置环境变量

然后，使用find_elements方法查找所有符合条件的div元素：

divs = driver.find_elements(By.CLASS_NAME, "your_class_name")  # 替换"your_class_name"为目标div的类名

接着，遍历找到的div元素，判断是否包含另一个div元素：

target_div = None
for div in divs:
    if div.find_elements(By.TAG_NAME, "div"):
        target_div = div
        break

最后，如果找到了包含另一个div元素的div，就可以找到第三个div并复制其中的文本：

if target_div:
    third_div = target_div.find_elements(By.TAG_NAME, "div")[2]  # 找到第三个div元素
    text = third_div.text  # 复制其中的文本
    print(text)

以上代码示例中，使用了By.CLASS_NAME来按类名查找元素，By.TAG_NAME来按标签名查找元素。可以根据实际情况替换为其他定位方法，如By.ID、By.XPATH等。

对于推荐的腾讯云相关产品和产品介绍链接地址，由于要求不能提及具体品牌商，这里无法给出相关链接。但可以参考腾讯云官方文档或搜索相关内容来了解腾讯云在云计算领域的产品和服务。

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

九.网络爬虫之Selenium基础技术万字详解（定位元素、常用方法、鼠标操作）

假设需要通过id属性定位页面中的杜甫、李商隐、杜牧三个超链接，HTML核心代码如下：如果需要获取div布局，则使用如下代码： test_div = driver.find_element_by_id...(‘nr’) print(test_div.text) 如果写成如下代码，则返回第一个诗人的信息。.../Desktop/09.selenium/blog09.html") print(driver.title) #查找元素并输入内容 test_div = driver.find_elements_by_id...第二句是定位“id=nr”的div元素，再找到它的第三个超链接a子元素。第三句是定位name属性为“dumu”的第一个超链接a元素。...点击按钮后弹出界面如图13所示，接下来需要分析用户名和密码的HTML源码，并找到其节点位置后实现自动登录操作。

4.6K1 0

Python：正则表达式re模块

那么对于文本的过滤或者规则的匹配，最强大的就是正则表达式，是Python爬虫世界里必不可少的神兵利器。...给定一个正则表达式和另一个字符串，我们可以达到如下的目的：给定的字符串是否符合正则表达式的过滤逻辑（“匹配”）；通过正则表达式，从文本字符串中获取我们想要的特定部分（“过滤”）。...，它也是一次匹配，只要找到了一个匹配的结果就返回，而不是查找所有匹配的结果，它的一般使用形式如下： search(string[, pos[, endpos]]) 其中，string 是待匹配的字符串，...findall 以列表形式返回全部能匹配的子串，如果没有匹配，则返回一个空列表。...它的使用形式如下： sub(repl, string[, count]) 其中，repl 可以是字符串也可以是一个函数：如果 repl 是字符串，则会使用 repl 去替换字符串每一个匹配的子串，并返回替换后的字符串

4174 0

python正则表达式

本篇将介绍python正则表达式，更多内容请参考：【python正则表达式】什么是正则表达式正则表达式，又称规则表达式，通常被用来检索、替换那些符合某个模式（规则）的文本。...给定一个正则表达式和另一个字符串，我们可以达到如下的目的：给定的字符串是否符合正则表达式的过滤逻辑(“匹配”) 通过正则表达式，从文本字符串中获取到我们想要的特定部分（“过滤”） ?...，它也是一次匹配，只要找到了一个匹配的结果就返回，而不是查找所有匹配的结果，它的一般使用形式如下： search[string[, pos[, endpos]]] 其中，string是待匹配的字符串，pos...findall是以列表形式返回全部能匹配到的子串，如果没有匹配，则返回一个空列表。...它的使用形式如下： sub(repl, string[, count]) 其中，repl可以是字符串也可以是一函数：如果repl是字符串，则会使用repl去替换字符串每一个匹配的子串，并返回替换后的字符串

1.1K6 1

Python爬虫(十)_正则表达式

1K6 0

Python爬虫网页，解析工具lxml.html（二）

如果你依然在编程的世界里迷茫，不知道自己的未来规划，可以加入我们的Python学习扣qun：784758214，看看前辈们是如何学习的！交流经验！...，我们重点讨论跟解析网页相关的函数，而修改这个对象的方法若与提取内容相关也一并介绍，介绍过程结合下面这段HTML代码以便更好说明问题： <...（path）,. find（path）,. findtext（path）方法通过路径（Xpath的）或标签查找特定节点，前者返回找到的第一个，第二个返回找到的全部HTML元素，第三个返回找到的第一个的节点的文本...//a') Out[76]: 'link' .find_class（CLASS_NAME）方法通过类名称查找所有含有CLASS_NAME的元素，返回的HtmlElement的列表 In [70]: doc...getprevious（）方法获取后一个或前一个节点，如果没有则返回无。

1.4K2 0

四.网络爬虫之入门基础及正则表达式抓取博客案例

，通过Pattern提供的一系列方法可以对文本进行匹配查找。...下标处起开始匹配pattern，如果pattern结束时已经匹配，则返回一个match对象；如果匹配过程中pattern无法匹配，或者匹配未结束就已到达endpos，则返回None。...注意，Python3解析本地文件可能会出错，掌握方法更重要。如果包含属性值，则正则表达式修改为“(.?)”。...，即找到class属性为“essay”的div，就可以定位第一篇文章的位置。...调用find()函数查找特定的内容，比如class属性为“essay”的div标签，依次定位获取开始和结束的位置。进行下一步分析，获取源码中的超链接和标题等内容。

8041 0

四.网络爬虫之入门基础及正则表达式抓取博客案例

1.4K1 0

Python爬虫Xpath库详解

etree 模块，然后声明了一段 HTML 文本，调用 HTML 类进行初始化，这样就成功构造了一个 XPath 解析对象。...如果要取出其中一个对象，可以直接用中括号加索引，如 [0]。 6. 子节点我们通过 / 或 // 即可查找元素的子节点或子孙节点。...如果想获取某些特定子孙节点下的所有文本，可以先选取到特定的子孙节点，然后再调用 text 方法方法获取其内部文本，这样可以保证获取的结果是整洁的。 10....div 除法 8 div 4 2 = 等于 age=19 如果 age 是 19，则返回 true。...如果想查询更多 Python lxml 库的用法，可以查看 lxml - Processing XML and HTML with Python。如果本文对你有帮助，不要忘记点赞，收藏+关注！

2041 0

「Python爬虫系列讲解」八、Selenium 技术

若不包括则报错，若包括则继续执行下一条语句 assert "百度" in driver.title # 查找元素定位百度搜索输入文本框（见上图） elem = driver.find_element_by_name.../div[a/@name='dumu']") # 方法二：定位“id='nr'”的元素，再找到它的第三个超链接 a 子元素 test_div2 = driver.find_element_by_xpath...该方法返回第一个匹配该链接文本值的元素。如果没有元素与该链接文本匹配，则抛出一个 NoSuchElementException 异常。...("tj_login") login.click() 通过 id 值查找 “用户名登录” 并单击它。...方法含义 size 获取元素的尺寸 text 获取元素的文本 location 获取元素的坐标，先找到要获取的元素，再调用该方法 page_source 返回页面源码 title 返回页面标题 current_url

7K2 0

Python 正则表达式

方法用于查找字符串的头部（也可以指定起始位置），它是一次匹配，只要找到了一个匹配的结果就返回，而不是查找所有匹配的结果。...1, in IndexError: no such group search 方法 search 方法用于查找字符串的任何位置，它也是一次匹配，只要找到了一个匹配的结果就返回，而不是查找所有匹配的结果...当匹配成功时，返回一个 Match 对象，如果没有匹配上，则返回 None。...findall 以列表形式返回全部能匹配的子串，如果没有匹配，则返回一个空列表。...它的使用形式如下： sub(repl, string[, count]) 其中，repl 可以是字符串也可以是一个函数：如果 repl 是字符串，则会使用 repl 去替换字符串每一个匹配的子串，并返回替换后的字符串

8226 0

Python3网络爬虫实战-28、解析库

etree 模块，然后声明了一段 HTML 文本，调用 HTML 类进行初始化，这样我们就成功构造了一个 XPath 解析对象，在这里注意到 HTML 文本中的最后一个 li 节点是没有闭合的，但是 etree...，其中前两个就是 li 的子节点 a 节点内部的文本，另外一个就是最后一个 li 节点内部的文本，即换行符。...如果我们想获取某些特定子孙节点下的所有文本，可以先选取到特定的子孙节点，然后再调用 text() 方法获取其内部文本，这样可以保证获取的结果是整洁的。 10....* 4 24 div 除法 8 div 4 2 = 等于 price=9.80 如果 price 是 9.80，则返回 true。...如果 price 是 9.90，则返回 false。 != 不等于 price!=9.80 如果 price 是 9.90，则返回 true。如果 price 是 9.80，则返回 false。

2.3K2 0

Python正则表达式re模块简明笔记

方法 subn 方法 match 方法 match 方法用于查找字符串的头部（也可以指定起始位置），它是一次匹配，只要找到了一个匹配的结果就返回，而不是查找所有匹配的结果。...，它也是一次匹配，只要找到了一个匹配的结果就返回，而不是查找所有匹配的结果，它的一般使用形式如下： search(string[, pos[, endpos]]) 其中，string 是待匹配的字符串...当匹配成功时，返回一个 Match 对象，如果没有匹配上，则返回 None。...findall 以列表形式返回全部能匹配的子串，如果没有匹配，则返回一个空列表。...它的使用形式如下： sub(repl, string[, count]) 其中，repl 可以是字符串也可以是一个函数：如果 repl 是字符串，则会使用 repl 去替换字符串每一个匹配的子串，并返回替换后的字符串

5085 0

一文解读JavaScript中的文档对象（DOM）

查找HTML元素 document.getElementsByTagName() #通过标签名查找HTML元素 document.getElementsByClassName() #通过类名查找...HTML元素 document.querySelector(".h") #第一个类名为 "h" 的元素 document.querySelectorAll("div.no, div#h"...这里我们获取到了所有的Div元素，我们可以针对性的获取一个ID下的Div的子元素以及它的兄弟和父，子元素，如下： 6)).创建节点我们可以自定义节点并添加值，不过要将它添加到文档中去，所以必须添加节点...，被替换的节点) 10)).复制节点 a.cloneChild() #复制a节点,复制出来的节点作为返回值为true时，则a元素后代也一并复制。...a.item(num) 返回节点列表中位于指定下标的节点 a.length 返回节点列表中的节点数 12)).获取元素文本 a.innerHTML 获取或者设置对象内的

6982 0

JQuery选择器和JQuery包装集

，如果其中至少有一个元素符合这个给定的表达式就返回true $("p").parent()查找每个段落的父元素：示例 HTML 代码：HelloHello执行$("p").parent()之后结果为：[ HelloHello] $("p").parent(".selected")查找段落的父元素中每个类名为...parent(".selected")之后结果为：[ Hello Again ] 其他使用is()方法查找段落的父元素中每个类名为...") // 使用is()方法会有返回值，如果满足条件，则flagValue会为true; $("input").map(function(){}).get().join(", ")把form中的每个input...第一个元素是0.如果是负数，则可以从集合的尾部开始选起。第二个参数：结束选取自己的位置，如果不指定，则就是本身的结尾。

3.1K2 0

selenium学习笔记

它提供了一组API，可以通过编程方式控制浏览器，并模拟用户的交互行为，例如点击、输入文本和导航等。...等，此种方法需要注意数据的完整性，页面上一个操作可能会涉及到多个接口的调用，如果调用不全可能会造成一些异常数据，另外如果请求中有一些自定义的加密请求头，就需要扒前端源码，找到加密算法，前端源码往往是经过编译后的...，如果它是当前打开的最后一个窗口，则退出浏览器。...如果10s内找到则返回元素,如果10秒没有找到则抛出异常 WebElement element = driver.findElement(By.id("myElement"))...显示等待可以根据不同的条件进行等待，例如元素的可见性、可点击性、文本内容、属性值等。显示等待可以通过ExpectedConditions类来实现。

1421 0

【译】停止滥用div! HTML语义化介绍

如果每个人都有标准化的方法来标记web文档中常见结构，那么在不熟悉代码库的情况下，都可以很容易的浏览HTML文件并快速处理它应该展示的内容。如果只有一个这样的标准......如果文档中存在多个main元素，则必须使用隐藏属性隐藏所有其它（main）实例。 -- www.w3.org/TR/html5/gr… 这很独特。...整体：元素用于表示完全独立的内容区域，这些内容可以从页面中提取出来并放入另一个内容中，并且仍然有意义。...而且，不仅更容易阅读，它对辅助技术更有用；机器人不能总是弄清楚你的特定类名模式，但是它们可以遵循这种结构。使用：这个元素比其它元素更有名。...根本不改变结构，但你知道它是什么，一目了然而不需要在上读物和处理类名来找到它，更重要的是机器人也可以找到它。

1.8K2 0

python简单面试题

（赋值，浅拷贝，深拷贝的区别）答：赋值（=），就是创建了对象的一个新的引用，修改其中任意一个变量都会影响到另一个。...} 深拷贝：创建一个新的对象，并且递归的复制它所包含的对象（修改其中一个，另外一个不会改变）{copy模块的deep.deepcopy()函数} 7.介绍一下except的用法和作用？...try下的语句正常执行，则执行else块代码。如果发生异常，就不会执行如果存在finally语句，最后总是会执行。 8.Python中pass语句的作用是什么？...14.有没有一个工具可以帮助查找python的bug和进行静态的代码分析？...如果一个变量名在当前类的字典中没有被发现，系统将会在这个类的祖先(例如，它的父类)中继续寻找，直到找到为止(如果一个变量名在这个类和这个类的祖先中都没有，那么将会引发一个AttributeError错误

9352 0

JavaScript(十)

如果是，则取得并保存 nodeName 的值。对于元素节点，nodeName 中保存的始终都是元素的标签名，而 nodeValue 的值则始终为 null。...最后一个方法是 normalize()，这个方法唯一的作用就是处理文档树中的文本节点。如果找到了空文本节点，则删除它，如果找到相邻的文本节点，则将它们合并为一个文本节点。...document 对象还有一些标准的 Document 对象所没有的属性，其中第一个属性就是 title，包含着 title 元素中的文本——显示在浏览器窗口的标题栏或标签页上。...getElementById() 方法接收一个参数: 要取得的元素的 ID。如果找到相应的元素则返回该元素，如果不存在带有相应 ID 的元素，则返回 null。...如果特性已经存在，setAttribute() 会以指定的值替换现有的值，如果特性不存在，setAttribute() 则创建该属性并设置相应的值。

6811 0

如何用Python抓取最便宜的机票信息（上）

如果你非常认真的对待，您可以在服务器上运行脚本(一个简单的Raspberry Pi就可以了)，并让它每天启动一两次。...我在编写代码时考虑了结果页面，所以如果只想搜索特定的日期，很可能需要做一些调整。我会试着在整篇文章中指出这些变化，但如果你卡住了，请在评论中留言给我。点击搜索按钮，在地址栏中找到链接。...上面代码中的红色文本是XPath选择器，如果在任何地方右键单击网页并选择“inspect”，就可以看到它。再次单击右键要查看代码的位置，并再次检查。 ?...它搜索具有属性data-code = price的元素a。第一个选项查找id等于wtKI-price_aTab的元素，并遵循第一个div元素、四个div和两个span。这次会成功的。...基于上面显示的内容，如果我们想在列表中以几个字符串的形式获得所有搜索结果，该怎么办?其实很简单。每个结果都在一个对象中，这个对象的类是“resultWrapper”。

3.7K2 0

python爬虫之lxml库xpath的基本使用

是python的一个解析库，支持HTML和XML的解析，支持XPath解析方式，而且解析效率非常高 XPath，全称XML Path Language，即XML路径语言，它是一门在XML文档中查找信息的语言...or age=20 如果age等于19或者等于20则返回true反正返回false and 与 age>19 and age<21 如果age等于20则返回true，否则返回false mod 取余 5...节点 2获取子节点通过/或者//即可查找元素的子节点或者子孙节点，如果想选择li节点的所有直接a节点，可以这样使用 result=html.xpath('//li/a') #通过追加/a选择所有li...9按序选择有时候，我们在选择的时候某些属性可能同时匹配多个节点，但我们只想要其中的某个节点，如第二个节点或者最后一个节点，这时可以利用中括号引入索引的方法获取特定次序的节点： from lxml import...link5.html 　　15、我们知道我们使用xpath拿到得都是一个个的ElementTree对象，所以如果需要查找内容的话，还需要遍历拿到数据的列表。

1.1K2 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

Python Seleinum查找特定类的div，如果另一个div位于其中，则找到第三个div并复制其中的文本

相关·内容

九.网络爬虫之Selenium基础技术万字详解（定位元素、常用方法、鼠标操作）

Python：正则表达式re模块

python正则表达式

Python爬虫(十)_正则表达式

Python爬虫网页，解析工具lxml.html（二）

四.网络爬虫之入门基础及正则表达式抓取博客案例

四.网络爬虫之入门基础及正则表达式抓取博客案例

Python爬虫Xpath库详解

「Python爬虫系列讲解」八、Selenium 技术

Python 正则表达式

Python3网络爬虫实战-28、解析库

Python正则表达式re模块简明笔记

一文解读JavaScript中的文档对象（DOM）

JQuery选择器和JQuery包装集

selenium学习笔记

【译】停止滥用div! HTML语义化介绍

python简单面试题

JavaScript(十)

如何用Python抓取最便宜的机票信息（上）

python爬虫之lxml库xpath的基本使用

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐