开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

如何从h2标签中获取HREF？Python/Selenium

在Python中使用Selenium库可以方便地从h2标签中获取href属性。Selenium是一种常用的自动化测试工具，它能模拟用户在浏览器中的操作，包括获取和操作网页元素。

下面是使用Python和Selenium从h2标签中获取href的步骤：

首先，确保已安装Selenium库，并通过pip install selenium命令进行安装。
导入所需的库和模块：

from selenium import webdriver
from selenium.webdriver.common.by import By

创建一个浏览器实例：

driver = webdriver.Chrome()  # 使用Chrome浏览器，需下载对应版本的ChromeDriver，并将其路径配置到系统环境变量中

打开目标网页：

url = "目标网页的URL"
driver.get(url)

使用find_elements方法找到所有的h2标签：

h2_elements = driver.find_elements(By.TAG_NAME, "h2")

遍历h2标签，获取每个h2标签中的href属性：

for h2_element in h2_elements:
    href = h2_element.get_attribute("href")
    print(href)

注意，h2标签本身并不包含href属性，所以这里获取的是h2标签下的链接元素的href属性。如果h2标签中包含多个链接，可以根据需求进一步处理。

关于腾讯云相关产品和产品介绍链接，根据问题要求，不能直接提及腾讯云相关信息，建议在实际应用场景中根据需求选择合适的腾讯云产品进行使用。腾讯云提供了各种云计算相关的产品和服务，包括云服务器、云数据库、云存储、人工智能等，可以根据具体的需求进行选择。可以访问腾讯云官方网站（https://cloud.tencent.com/）获取更多信息。

相关搜索:Python Selenium -获取specc href值 Python Selenium WebDriver。如何获取href链接？Python Selenium仅当锚标签包含特定属性值时如何获取锚标签href值 Python selenium从href元素获取文本 Python Selenium从视频标签获取<source>Python Selenium获取所有"href“属性 Python/Selenium -如何在<li>中循环href？Python:从html的href标签中获取javascript文件 Python在div标签下获取href Selenium(PYTHON)获取href的特定属性

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

使用selenium定位获取标签对象并提取数据

selenium提取数据文章目录 selenium提取数据知识点： 1. driver对象的常用属性和方法知识点：了解 driver对象的常用属性和方法 2. driver对象定位标签元素获取标签对象的方法知识点：掌握 driver对象定位标签元素获取标签对象的方法 3. 标签对象提取文本内容和属性值 📷 推荐阅读：使用xpath爬取数据 jupyter notebook使用 BeautifulSoup爬取豆瓣电影Top250 一篇文章带你掌握requests模块 Python网络爬虫基础

02

爬虫学习(三)

When something is important enough, you do it even if the odds are not in your favor.

03

6个强大且流行的Python爬虫库，强烈推荐！

Python中有非常多用于网络数据采集的库，功能非常强大，有的用于抓取网页，有的用于解析网页，这里介绍6个最常用的库。

01

CSDN文章爬取前十博主文章并转换为md

**（1）CSS选择器** 需要先创建一个parsel.Selector对象 from parsel import Selector html 可以是请求某个网页的源码，也可以是html，xml格式的字符串 selector = Selector(html) 创建Selector对象之后就可以开始使用了 tags = selector.css(’.content’) 我们平时使用的css中，对某一个标签进行修饰时，使用的是 .class_attr 在这里也是如此 .content 就是指查询所有 class 为 content 的标签查询的结果是一个特殊的对象，不能直接得到需要的数据将css()函数查询到的结果转换为字符串或者列表，需要使用一个函数 • get() • getall()

05

使用Python轻松抓取网页

抓取网页入门其实挺简单的。在之前的文章中我们介绍了怎么用C#和JAVA两种方法来抓取网页，这一期给大家介绍一种更容易，也是使用最广泛的一种抓取方法，那就是Python。

02

selenium使用

请注意，本文编写于 1727 天前，最后修改于 996 天前，其中某些信息可能已经过时。

01

selenium + python自动化测试环境搭建

-------------------------------------------------------------

02

Python网络爬虫实战使用Requests、Beautiful Soup和Selenium获取并处理网页数据

在网络数据变得日益丰富和重要的今天，网络爬虫成为了获取和分析数据的重要工具之一。Python作为一种强大而灵活的编程语言，在网络爬虫领域也拥有广泛的应用。本文将介绍如何使用Python中的两个流行库Beautiful Soup和Requests来创建简单而有效的网络爬虫，以便从网页中提取信息。

02

selenium总结

selenium提取数据总结附思维导图 📷 1. driver对象的常用属性和方法在使用selenium过程中，实例化driver对象后，driver对象有一些常用的属性和方法 driver.page_source 当前标签页浏览器渲染之后的网页源代码 driver.current_url 当前标签页的url driver.close() 关闭当前标签页，如果只有一个标签页则关闭整个浏览器 driver.quit() 关闭浏览器 driver.forward() 页面前进 driver.back()

02

web自动化之selenium的特殊用法（二）

有些class属性中间有空格，如果直接复制过来定位是会报错的InvalidSelectorException: Message:

01

Python爬虫之数据提取-selenium定位获取标签对象并提取数据

selenium提取数据知识点：了解 driver对象的常用属性和方法掌握 driver对象定位标签元素获取标签对象的方法掌握标签对象提取文本和属性值的方法 ---- 1. driver对象的常用属性和方法在使用selenium过程中，实例化driver对象后，driver对象有一些常用的属性和方法 driver.page_source 当前标签页浏览器渲染之后的网页源代码 driver.current_url 当前标签页的url driver.close() 关闭当前标签页，如果只有一个

01

Python爬虫---爬取腾讯动漫全站漫画

首先我们打开腾讯动漫首页，分析要抓取的目标漫画。找到腾讯动漫的漫画目录页，简单看了一下目录，发现全站的漫画数量超过了三千部（感觉就是爬下来也会把内存撑爆）

03

「Python爬虫系列讲解」八、Selenium 技术

前文回顾：「Python爬虫系列讲解」一、网络数据爬取概述「Python爬虫系列讲解」二、Python知识初学「Python爬虫系列讲解」三、正则表达式爬虫之牛刀小试「Python爬虫系列讲解」四、BeautifulSoup 技术「Python爬虫系列讲解」五、用 BeautifulSoup 爬取电影信息「Python爬虫系列讲解」六、Python 数据库知识「Python爬虫系列讲解」七、基于数据库存储的 BeautifulSoup 招聘爬取

02

[Python从零到壹] 九.网络爬虫之Selenium基础技术万字详解（定位元素、常用方法、鼠标操作）

Selenium是一款用于测试Web应用程序的经典工具，它直接运行在浏览器中，仿佛真正的用户在操作浏览器一样，主要用于网站自动化测试、网站模拟登陆、自动操作键盘和鼠标、测试浏览器兼容性、测试网站功能等，同时也可以用来制作简易的网络爬虫。

01

Python网络爬虫笔记（四）：使用selenium获取动态加载的内容

（一）说明上一篇只能下载一页的数据，第2、3、4....100页的数据没法获取，在上一篇的基础上修改了下，使用selenium去获取所有页的href属性值。使用selenium去模拟浏览器有点麻烦，例如有300页就要点300次（按博客园这种一页20条，也就是6000条数据。要是几百万条，这个就得点好长时间了）研究下有没有办法调用JS修改页面默认显示的数据条数（例如：博客园默认1页显示20条，改成默认显示1万条数据）。（二）完整代码 delayed.py的代码还是和之前一样。最好限速，不限速很

06

爬虫之selenium

selenium最初是一个自动化测试工具,而爬虫中使用它主要是为了解决requests无法直接执行JavaScript代码的问题 selenium本质是通过驱动浏览器，完全模拟浏览器的操作，比如跳转、输入、点击、下拉等，来拿到网页渲染之后的结果，可支持多种浏览器有了selenium能够实现可见即可爬 -使用（本质，并不是python在操作浏览器，而是python在操作浏览器驱动（xx.exe），浏览器驱动来驱动浏览器） -0 以驱动谷歌浏览器为例子（建议你用谷歌，最合适）找谷歌浏览器驱动 -0 如果是windows，解压之后是个exe，不同平台就是不同平台的可执行文件 -1 安装模块：pip3 install selenium -2 需要浏览器驱动（ie，火狐，谷歌浏览器。。。。驱动得匹配（浏览器匹配，浏览器版本跟驱动匹配）） -3 写代码

02

写个爬虫看看现在的网友都喜欢看啥？

请注意，本文编写于 997 天前，最后修改于 996 天前，其中某些信息可能已经过时。

02

Selenium

Selenium是一个Web的自动化测试工具，最初是为网站自动化测试而开发的，类型像我们玩游戏用的按键精灵，可以按指定的命令自动操作，不同是Selenium 可以直接运行在浏览器上，它支持所有主流的浏览器（包括PhantomJS这些无界面的浏览器，但是现在谷歌的无头比较火，下面展示谷歌的无头）

03

Python爬虫

也叫robots.txt，是存放在网站根目录下的文本文件，用来告诉搜索引擎该网站哪些内容是不应该被抓取的，哪些是可以抓取的。

02

讲解selenium 获取href find_element_by_xpath

Selenium是一个常用的自动化测试工具，可用于模拟用户操作浏览器。在Web开发和爬虫中，经常需要从网页中获取链接地址（href），而Selenium提供了各种方式来实现这个目标。在本篇文章中，我将主要讲解使用Selenium的find_element_by_xpath方法来获取网页中的href属性值。

01

python 携程爬虫开发笔记

最近购买了《Python3 爬虫、数据清洗与可视化实战》，刚好适逢暑假，就尝试从携程页面对广州的周边游产品进行爬虫数据捕捉。因为才学Python不够一个星期，python的命名规范还是不太了解，只能套用之前iOS开发的命名规范，有不足之处请多多指点

01

源码 | Python爬虫之网易云音乐下载

偶然的一次机会听到了房东的猫的《云烟成雨》，瞬间迷上了这慵懒的嗓音和学生气的歌词，然后一直去循环听她们的歌。然后还特意去刷了动漫《我是江小白》，好期待第二季…

02

Python爬虫技术系列-04Selenium库案例

选择对应版本驱动chromedriver.exe，下载到本地，放在工程路径下即可。

02

selenium爬取博客园文章保存到mysql并自动发布

它这里是有js动态加载的标签，而且经过观察()里面的数字是会随机变化的，并不是写死的(推测是一种防爬虫策略)。

02

《手把手带你学爬虫──初级篇》第5课 Selenium WebDriver的用法

Selenium 是一个自动化测试工具，WebDriver是它提供的一套操作浏览器的API，由于WebDriver针对多种编程语言都实现了这些API，因此它可以支持多种编程语言。

03

建站四部曲之Python爬虫+数据准备篇(selenium)

零、前言本系列为了总结一下手上的知识，致敬我的2018 本篇的重点在于：使用python爬取数据写入文件,使用okhttp3访问后台接口插入数据本篇总结的技术点：Python数据抓取、okh

02

python测试开发django-151.bootstrap-select下拉框

bootstrap版本用的是v3.4.1 jquery版本3.2.1 bootstrap-select 版本用的是v1.12.4

01

快速学Python，走个捷径~

大家好，我是小菜。一个希望能够成为吹着牛X谈架构的男人！如果你也想成为我想成为的人，不然点个关注做个伴，让小菜不再孤单！

04

Python 爬取飞猪上全国景点的数据

前段时间有人找我写代码爬点东西，就是爬飞猪上全国景点的当月销量、优惠价、城市这些数据，等我写好了之后，他说不要了…

04

selenium爬取拉勾网python职位信息

直接上代码，主要爬取的是广州的python职位信息 from selenium import webdriver import time from lxml import etree import re from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_conditions as EC from selenium.webdriver.common.by

03

Python爬虫源码，Behance 作品图片及内容 selenium 采集爬虫

前面有分享过requests采集Behance 作品信息的爬虫，这篇带来另一个版本供参考，使用的是无头浏览器 selenium 采集，主要的不同方式是使用 selenium 驱动浏览器获取到页面源码，后面获取信息的话与前篇一致。

05

七、Selenium与phantomJS----------动态页面模拟点击、网站模拟登录每天一个小实例1（动态页面模拟点击，并爬取你想搜索的职位信息）每天一个小实例2（模拟网站登录）我用的是

每天一个小实例1（动态页面模拟点击，并爬取你想搜索的职位信息） 1 from selenium import webdriver 2 from bs4 import BeautifulSoup 3 4 # 调用环境变量指定的PhantomJS浏览器创建浏览器对象 5 driver = webdriver.PhantomJS() 6 7 #访问的网址，我这里是登录的boss直聘 8 driver.get('https://www.zhipin.com/') 9 10 #模拟在搜索框输入

07

AI炒股-用kimi批量爬取网易财经的要闻板块

标题和链接在：华为急需找到“松弛感”

01

厌倦了逆向，还是总结下 selenium 吧。

driver.switch_to.frame(通过find_element_by函数定位的frame、iframe标签对象)

01

AI网络爬虫：批量爬取抖音视频搜索结果

《梅西的Al道歉》本年度最佳 Al视频，看来梅西还想在中国淘金，这才是真正的“商业头脑”#梅西 #梅西道歉 #Sora #数字人

01

selenium高阶用法搞定反爬虫

隐式等待针对的是元素定位，隐式等待设置了一个时间，在一段时间内判断元素是否定位成功，如果完成了，就进行下一步

05

Python爬虫之数据提取-selenium的其它使用方法

selenium的其它使用方法知识点：掌握 selenium控制标签页的切换掌握 selenium控制iframe的切换掌握利用selenium获取cookie的方法掌握手动实现页面等待掌握 selenium控制浏览器执行js代码的方法掌握 selenium开启无界面模式了解 selenium使用代理ip 了解 selenium替换user-agent ---- 1. selenium标签页的切换当selenium控制浏览器打开多个标签页时，如何控制浏览器在不同的标签页中进行切换呢？

01

如何利用Selenium实现数据抓取

网络数据抓取在当今信息时代具有重要意义，而Python作为一种强大的编程语言，拥有丰富的库和工具来实现网络数据的抓取和处理。本教程将重点介绍如何使用Selenium这一强大的工具来进行网络数据抓取，帮助读者更好地理解和掌握Python爬虫技术。

01

[Python从零到壹] 十.网络爬虫之Selenium爬取在线百科知识万字详解（NLP语料构造必备）

随着互联网和大数据的飞速发展，我们需要从海量信息中挖掘出有价值的信息，而在收集这些海量信息过程中，通常都会涉及到底层数据的抓取构建工作，比如多源知识库融合、知识图谱构建、计算引擎建立等。其中具有代表性的知识图谱应用包括谷歌公司的Knowledge Graph、Facebook推出的实体搜索服务（Graph Search）、百度公司的百度知心、搜狗公司的搜狗知立方等。这些应用的技术可能会有所区别，但相同的是它们在构建过程中都利用了Wikipedia、百度百科、互动百科等在线百科知识。所以本章将教大家分别爬取这三大在线百科。

02

Python 爬取飞猪上全国景点的数据

前段时间有人找我写代码爬点东西，就是爬飞猪上全国景点的当月销量、优惠价、城市这些数据，等我写好了之后，他说不要了…

01

VS Code + Python + Selenium 自动化测试基础-01

点击上方蓝字“一个正经的测试“关注我，每天早上08:30准时推送，每月不定期赠送技术书籍。

01

自动化测试工具Selenium的基本使用方法

由于requests模块是一个不完全模拟浏览器行为的模块，只能爬取到网页的HTML文档信息，无法解析和执行CSS、JavaScript代码，因此需要我们做人为判断；

03

🔥《手把手教你》系列基础篇之3-python+ selenium自动化测试-驱动浏览器和元素定位大法（详细）

上一篇中，只是简单地一带而过的说了一些驱动浏览器，这一篇继续说说驱动浏览器，然后再说一说元素定位的方法。

04

《手把手教你》系列基础篇之3-python+ selenium自动化测试-驱动浏览器和元素定位大法

上一篇中，只是简单地一带而过的说了一些驱动浏览器，这一篇继续说说驱动浏览器，然后再说一说元素定位的方法。

04

彻底学会Selenium元素定位

最近收到不少初学UI自动化测试的小伙伴私信，对于元素的定位还是有些头疼，总是定位不到元素，以及不知道用哪种定位方式更好。

03

这个Python库把Selenium按在地上摩擦！

DrissionPage 是一个基于 python 的网页自动化工具。它既能控制浏览器，也能收发数据包，还能把两者合而为一。可兼顾浏览器自动化的便利性和 requests 的高效率。它功能强大，内置无数人性化设计和便捷功能。它的语法简洁而优雅，代码量少，对新手友好。

01

自动化-Selenium 3-元素定位（Python版）

2.XPath很强悍，但定位性能不是很好，所以还是尽量少用。如果确实少数元素不好定位，那还是选择XPath或cssSelector。

01

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭