前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >Selenium 简单介绍、安装、启动

Selenium 简单介绍、安装、启动

作者头像
友儿
发布于 2022-10-05 10:34:54
发布于 2022-10-05 10:34:54
36000
代码可运行
举报
文章被收录于专栏:友儿友儿
运行总次数:0
代码可运行

Selenium简单介绍

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
https://selenium-python.readthedocs.io/
https://python-selenium-zh.readthedocs.io/zh_CN/latest/

什么是selenium

通过浏览器驱动来自动化操纵浏览器的工具

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
selenium -> 传输指令 -> webdriver -> 转换指令 -> 浏览器

webdriver的出现是为了兼容各语言各版本, 使java或者python都可以通过同一个webdriver达到操纵浏览器的目的.

selenium常用来做什么?

本质是模拟用户行为, 可以用于以下领域

  • 自动化测试
  • 获取网页数据
    • 复杂动态网页
    • 账号比较重要, 保证不被反爬风控
    • 数据量小, 但是验证复杂的网站
    • 获取session
      • 用户端无法获取session, 但是selenium可以

Selenium安装

安装Python版本的selenium

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
pip install selenium

查看当前浏览器版本

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
最新版本为89

下载对应浏览器版本的chrome driver

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
http://npm.taobao.org/mirrors/chromedriver/

下载后解压至特定目录

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
H:\drivers\chromedriver.exe

快速启动

创建一个webdriver驱动实例

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
from selenium import webdriver

driver_path = r"H:\drivers\chromedriver.exe"
browser = webdriver.Chrome(executable_path=driver_path)

浏览器设置

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
chrome_options = webdriver.ChromeOptions()
chrome_options.add_argument("disable-blink-features=AutomationControlled")
browser = webdriver.Chrome(executable_path=driver_path, 

请求网址

定位搜索框并模拟键盘输入

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
search_input = browser.find_element_by_css_selector('input[aria-label="搜索"]')
search_input.send_keys("鼠标")

定位搜索按钮并模拟鼠标输入

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
search_button = browser.find_element_by_css_selector('button[aria-label="搜索"]')
search_button.click()

页面解析

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
item_array = search.parse_jd_item(browser.page_source)
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
from selenium import webdriver
from jd_crawler.jd_parser import search
import time

driver_path = r"H:\drivers\chromedriver.exe"

chrome_options = webdriver.ChromeOptions()
chrome_options.add_argument("disable-blink-features=AutomationControlled")
browser = webdriver.Chrome(executable_path=driver_path, chrome_options=chrome_options)


def sim_search(keyword, url):
    browser.get(url)
    search_input = browser.find_element_by_css_selector('input[aria-label="搜索"]')
    search_input.send_keys(keyword)
    search_button = browser.find_element_by_css_selector('button[aria-label="搜索"]')
    search_button.click()


def main(keyword, url):
    sim_search(keyword, url)
    time.sleep(3)
    item_array = search.parse_jd_item(browser.page_source)
    print(item_array)
    browser.close()


if __name__ == "__main__":
    jd_url = "https://www.jd.com/"
    main("鼠标", jd_url)
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
用 selenium 和 scrapy 模拟知乎登录
这个是看一个视频学来的,视频给出的教程部分失效,因为知乎的登录页面改了。我进行一点修改就可以登录了,本文主要是记录
伪君子
2018/08/03
9050
用 selenium 和 scrapy 模拟知乎登录
Python 用 ChromeDriver 实现登录和签到
上个星期天,老师给我一堆账号,让我测试一下他们有没有去修改密码,我随手测试了几个之后发现有 500+ 个账户,想都没想就着手写代码了。
伪君子
2018/12/28
2.5K0
Python 用  ChromeDriver 实现登录和签到
Python爬虫——Selenium
安装chromium 官方下载地址是http://chromedriver.chromium.org/downloads,注意需要和本地安装的Chrome浏览器版本相匹配。如当前ChoreDriver2.42支持的Chrome版本是v68到v70
羊羽shine
2019/05/29
8700
15.selenium_case01
# 与百度首页交互 from selenium import webdriver from selenium.webdriver.support.wait import WebDriverWait from selenium.webdriver.common.by import By from selenium.webdriver.support import expected_conditions as EC option = webdriver.ChromeOptions() # option.ad
hankleo
2020/09/17
2690
Python之selenium模块
最初是一个自动化测试工具,通过模拟用户来驱动浏览器的一些操作,比如:访问页面,点击按钮,下载,下拉,输入等操作。并且其支持市面上主流的各种浏览器。
Tommonkey
2023/02/25
7110
Selenium&Chrome实战:动态爬取51job招聘信息
Selenium3.8版本以后,已经不支持PhanTomJS了,可以使用谷歌,火狐的无头浏览器来代替PhanTomJS
py3study
2020/01/07
1.8K0
WebDriver与Chrome DevTools Protocol:如何在浏览器自动化中提升效率
随着互联网数据的爆炸式增长,爬虫技术成为了获取信息的重要工具。在实际应用中,如何提升浏览器自动化的效率是开发者常常面临的挑战。Chrome DevTools Protocol(CDP)与Selenium WebDriver相结合,为浏览器自动化提供了强大的控制能力,并允许用户直接与浏览器的底层交互。本文将通过使用CDP优化Selenium的效率,结合代理IP技术,实现对微博数据的高效采集,并通过设置cookie和user-agent模拟真实用户行为。
jackcode
2024/09/05
3710
WebDriver与Chrome DevTools Protocol:如何在浏览器自动化中提升效率
实例演示如何结合Selenium和Requests进行自动化测试
Selenium和Requests是两个常用的自动化测试工具,它们都可以用于Web应用程序的自动化测试。Selenium主要用于模拟用户在Web应用程序中的操作,而Requests主要用于处理HTTP请求和响应。在本文中,我们将深入了解如何将Selenium和Requests结合起来使用,以实现更全面的Web应用程序自动化测试。
苦叶子
2023/06/09
8340
实例演示如何结合Selenium和Requests进行自动化测试
Python爬虫之selenium学习
基本概述 selenium可以便捷的获取网站中的动态加在的数据 selenium可以便捷的实现模拟登陆 selenium是基于浏览器自动化的一个模块 使用流程 bash pip install selenium 查看google浏览器版本号 bash # 在浏览器中输入 chrome://version/ 选择合适的版本 bash http://chromedriver.storage.googleapis.com/index.html 将下载好的chromedriver.exe放入开发目录中即可 运行测试
shaoshaossm
2022/12/26
4330
Python3 Selenium+Chr
以前抓取动态网页是用PhantomJS + Selenium + ChromeDriver,但是新版的Selenium不支持PhantomJS了,程序跑的时候总会跳出一些warnings.
py3study
2020/01/10
4860
Automagica小试
Automagica 是一个开源智能机器人流程自动化(SRPA,Smart Robotic Process Automation)平台,借助 Automagica 的python 函数库,可以通过简单程序脚本实现打开各种应用程序并对应用进行操作的功能,使自动化跨平台流程变得轻而易举。
py3study
2020/08/25
1.1K0
Automagica小试
自动化-Selenium 3-启动浏览器(Python版)
找到Chrome的chrome.exe应用程序的路径地址(例如C:\Program Files (x86)\Google\Chrome\Application\chrome.exe),加载到脚本里。
wangmcn
2022/07/22
1.2K0
自动化-Selenium 3-启动浏览器(Python版)
python爬虫–selenium模块
发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/100097.html原文链接:
全栈程序员站长
2021/04/19
7580
【Python爬虫实战】Selenium自动化网页操作入门指南
在现代网络开发和数据爬取中,Selenium 已成为不可或缺的自动化工具之一。无论是用于测试、数据抓取,还是模拟用户行为,Selenium 都可以在不干预的情况下自动化浏览器操作,为开发者节省大量时间和精力。本指南将带您从 Selenium 的安装配置到高级操作,逐步掌握网页自动化的核心技巧。
易辰君
2024/11/07
9600
Selenium
Selenium是一个Web的自动化测试工具,最初是为网站自动化测试而开发的,类型像我们玩游戏用的按键精灵,可以按指定的命令自动操作,不同是Selenium 可以直接运行在浏览器上,它支持所有主流的浏览器(包括PhantomJS这些无界面的浏览器,但是现在谷歌的无头比较火,下面展示谷歌的无头)
HammerZe
2022/05/11
3.2K0
Selenium
Selenium利用cookie免登陆音悦台
Cookie是浏览器(User Agent)访问一些网站后,这些网站存放在客户端的一组数据,用于使网站等跟踪用户,实现用户自定义功能
py3study
2020/01/07
9590
Python 基于 selenium 实现不同商城的商品价格差异分析系统
selenium 原本是一款自动化测试工具,因其出色的页面数据解析和用户行为模拟能力而常用于爬虫程序中,致使爬虫程序的爬取过程更简单、快捷。
一枚大果壳
2022/08/23
1.7K0
Python 基于 selenium 实现不同商城的商品价格差异分析系统
[1296]selenium配置带用户名和密码的隧道代理
参考:https://blog.csdn.net/crayonjingjing/article/details/137596882 https://segmentfault.com/q/1010000043258582
周小董
2024/11/24
1430
Python 爬虫(四):Selenium 框架
Selenium 是一个用于测试 Web 应用程序的框架,该框架测试直接在浏览器中运行,就像真实用户操作一样。它支持多种平台:Windows、Linux、Mac,支持多种语言:Python、Perl、PHP、C# 等,支持多种浏览器:Chrome、IE、Firefox、Safari 等。
Python小二
2020/08/18
1.1K0
Python 爬虫(四):Selenium 框架
Python之Selenium模拟浏览器
模拟浏览器功能,自动执行网页中的js代码,实现动态加载。使请求更加真实(好像是真的浏览器在请求)
鱼找水需要时间
2023/02/16
1.5K0
Python之Selenium模拟浏览器
相关推荐
用 selenium 和 scrapy 模拟知乎登录
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验