让ChromeDriver 125顺利运行：解决找不到chromedriver.exe的技巧

原创

jackcode

发布于 2024-06-03 13:21:36

2.9K0

背景/引言

在使用Selenium进行网页自动化或数据抓取时，ChromeDriver是一个不可或缺的工具。然而，有时我们会遇到诸如“ChromeDriver版本125无法找到chromedriver.exe”的错误。本文将详细介绍如何解决这一问题，并提供示例代码，展示如何在Selenium中使用代理IP、设置User-Agent和Cookie来进行数据抓取。

正文

一、确认ChromeDriver版本和路径

首先，确保您下载的ChromeDriver版本与安装的Chrome浏览器版本匹配。可以通过以下步骤进行检查：

打开Chrome浏览器，输入 chrome://settings/help 查看版本号。
访问 ChromeDriver官网下载对应版本的ChromeDriver。

下载完成后，将chromedriver.exe放在一个便于管理的目录下，例如 C:\chromedriver\。

二、设置环境变量

为了让系统识别chromedriver.exe，需要将其所在目录添加到环境变量中：

右键点击“此电脑”或“我的电脑”，选择“属性”。
点击“高级系统设置”。
在“系统属性”窗口中，点击“环境变量”。
在“系统变量”部分，找到Path，并点击“编辑”。
添加C:\chromedriver\到路径中。

三、使用Selenium和ChromeDriver

确保Python和Selenium库已安装，可以通过以下命令安装：

pip install selenium

下面是一个示例代码，展示了如何使用代理IP、设置User-Agent和Cookie来进行数据抓取。

示例代码

在示例代码中，我们使用了代理IP提高爬取成功率。使用代理IP时，需要配置代理服务器的地址、端口、用户名和密码。本文示例使用了爬虫代理加强版的配置方法。

from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.common.proxy import Proxy, ProxyType
from selenium.webdriver.chrome.options import Options

# 设置ChromeDriver的路径
chrome_driver_path = 'C:/chromedriver/chromedriver.exe'

# 配置代理IP
proxy = Proxy()
proxy.proxy_type = ProxyType.MANUAL
proxy.http_proxy = 'proxy.example.com:8080'  # 代理服务器地址和端口
proxy.ssl_proxy = 'proxy.example.com:8080'

# 使用爬虫代理加强版
proxy.http_proxy = '域名:端口'
proxy.ssl_proxy = '域名:端口'
proxy.socks_username = '用户名'
proxy.socks_password = '密码'

# 配置Chrome选项
chrome_options = Options()
chrome_options.add_argument("--proxy-server=http://域名:端口")
chrome_options.add_argument("user-agent=Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36")

# 设置Cookies
cookies = {
    'name': 'value',
    'another_cookie': 'another_value'
}

# 启动ChromeDriver
service = Service(chrome_driver_path)
driver = webdriver.Chrome(service=service, options=chrome_options)

# 打开目标网站
driver.get('http://example.com')

# 添加Cookies到浏览器
for name, value in cookies.items():
    driver.add_cookie({'name': name, 'value': value})

# 刷新页面以应用Cookies
driver.refresh()

# 执行抓取操作
content = driver.page_source
print(content)

# 关闭浏览器
driver.quit()