前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【教程】新的Selenium!整合了隐藏浏览器指纹等功能

【教程】新的Selenium!整合了隐藏浏览器指纹等功能

原创
作者头像
小锋学长生活大爆炸
发布2024-07-15 20:39:52
850
发布2024-07-15 20:39:52
举报
文章被收录于专栏:学习之旅

转载请注明出处:小锋学长生活大爆炸[xfxuezhagn.cn] 如果本文帮助到了你,欢迎[点赞、收藏、关注]哦~

目录

前景提要

driver = Driver()

常用driver 接口

最后的话

前景提要

新的selenium,整合了隐藏浏览器指纹,非常好用:

GitHub - seleniumbase/SeleniumBase📊 Python's all-in-one framework for web crawling, scraping, testing, and reporting. Supports pytest. UC Mode provides stealth. Includes many tools. - seleniumbase/SeleniumBase

https://github.com/seleniumbase/SeleniumBase 虽然官方的例程比较多,但相关文档的说明和解释不是很完善,所以这里简单记录一下常用的,以便查阅。本内容将根据我用到的内容不断更新。

driver = Driver()

比如可以这样用:

代码语言:javascript
复制
driver = Driver(browser="chrome", headless2=False, proxy="127.0.0.1:7890", undetectable=True, incognito=True, enable_3d_apis=False, do_not_track=True, binary_location="./chrome.exe", driver_version="./chromedriver.exe", page_load_strategy="normal",)

这是一个复杂的函数定义,用于配置和启动一个基于 Selenium 的浏览器驱动程序(如 Chrome、Edge、Firefox 或 Safari)。每个参数都提供了不同的配置选项,允许用户定制浏览器的行为和特性。以下是每个参数的详细解释:

代码语言:javascript
复制
def Driver(
    # 选择使用的浏览器类型,包括 "chrome"、"edge"、"firefox" 或 "safari"。
    browser=None,
    # 使用原始的无头模式(适用于 Chromium 和 Firefox)。
    headless=None,
    # Chromium 的新无头模式(具有更多功能)。
    headless2=None,
    # 在 Linux 上以有头/GUI 模式运行测试,非默认选项。
    headed=None,
    # 设置浏览器的语言区域代码。
    locale_code=None,
    # Selenium Grid 协议,选项为 "http" 或 "https"。
    protocol=None,
    # 用于测试的 Selenium Grid 服务器或 IP。
    servername=None,
    # 测试服务器使用的 Selenium Grid 端口。
    port=None,
    # 使用代理服务器。格式为 "SERVER:PORT" 或 "USER:PASS@SERVER:PORT"。
    proxy=None,
    # 在使用代理时跳过的域列表。
    proxy_bypass_list=None,
    # 使用 PAC 文件。格式为 URL 或 "USERNAME:PASSWORD@URL"。
    proxy_pac_url=None,
    # 在多线程情况下允许多个具有身份验证的代理。
    multi_proxy=False,
    # 修改浏览器的 User-Agent 字符串。
    agent=None,
    # 与 Selenium Grid 一起使用的期望能力文件。
    cap_file=None,
    # 与 Selenium Grid 一起使用的期望能力字符串。
    cap_string=None,
    # 启用 SeleniumBase Recorder 的 Chromium 扩展。
    recorder_ext=None,
    # 禁用网站的 JavaScript。页面可能会因此中断。
    disable_js=None,
    # 禁用网站的内容安全策略。
    disable_csp=None,
    # 在基于 Chromium 的浏览器上启用 Web 安全性。
    enable_ws=None,
    # 禁用 Web 安全性(与 enable_ws 相反,None 和 False 有区别)。
    disable_ws=None,
    # 在网站上启用 Chrome 同步。
    enable_sync=None,
    # 使用 Chrome 的自动化扩展。
    use_auto_ext=None,
    # 使用 undetected-chromedriver 以规避反机器人检测。
    undetectable=None,
    # 在 undetected-chromedriver 模式下捕获 CDP 事件。
    uc_cdp_events=None,
    # 使用 undetected-chromedriver 作为子进程。
    uc_subprocess=None,
    # 捕获 CDP 事件("performance": "ALL", "browser": "ALL")。
    log_cdp_events=None,
    # 弃用参数 - "--no-sandbox" 现在总是使用。
    no_sandbox=None,
    # 弃用参数 - 如果不是 "swiftshader",GPU 会被禁用。
    disable_gpu=None,
    # 启用 Chromium 的隐身模式。
    incognito=None,
    # 启用 Chromium 的访客模式。
    guest_mode=None,
    # 启用 Chromium 的黑暗模式。
    dark_mode=None,
    # 在浏览器打开时启用 Chromium 的开发者工具。
    devtools=None,
    # 在 "http://localhost:9222" 启用 Chrome 的调试器。
    remote_debug=None,
    # 启用 WebGL 和 3D APIs。
    enable_3d_apis=None,
    # 启用 Chrome 的 swiftshader(--use-gl=angle / --use-angle=swiftshader-webgl)。
    swiftshader=None,
    # 屏蔽某些类型的显示广告。
    ad_block_on=None,
    # 设置主机解析规则,用逗号分隔。
    host_resolver_rules=None,
    # 在测试期间阻止图像加载。
    block_images=None,
    # 告诉网站您不想被跟踪。
    do_not_track=None,
    # 设置 Chromium 参数,用逗号分隔。
    chromium_arg=None,
    # 设置 Firefox 参数,用逗号分隔。
    firefox_arg=None,
    # 设置 Firefox 首选项和值,用逗号分隔。
    firefox_pref=None,
    # 设置 Chrome 用户数据目录。
    user_data_dir=None,
    # 加载 Chrome 扩展 .zip 或 .crx 文件,用逗号分隔。
    extension_zip=None,
    # 加载 Chrome 扩展目录,用逗号分隔。
    extension_dir=None,
    # 禁用 Chrome 特性,用逗号分隔。
    disable_features=None,
    # 设置要使用的 Chromium 浏览器二进制文件路径。
    binary_location=None,
    # 设置 chromedriver 或 uc_driver 的版本。
    driver_version=None,
    # 设置 Chrome 页面加载策略,选项为 "normal"、"eager" 或 "none"。
    page_load_strategy=None,
    # 使用 selenium-wire 的 webdriver 代替 selenium webdriver。
    use_wire=None,
    # 设置 Chrome "plugins.always_open_pdf_externally": True。
    external_pdf=None,
    # 在运行测试时使用移动设备模拟器。
    is_mobile=None,
    # is_mobile 的快捷方式/重复项。
    mobile=None,
    # 设置设备宽度。
    d_width=None,
    # 设置设备高度。
    d_height=None,
    # 设置设备像素比。
    d_p_r=None,
    # undetectable 的快捷方式/重复项。
    uc=None,
    # undetectable 的快捷方式/重复项。
    undetected=None,
    # uc_cdp_events 的快捷方式/重复项。
    uc_cdp=None,
    # uc_subprocess 的快捷方式/重复项。
    uc_sub=None,
    # log_cdp_events 的快捷方式/重复项。
    log_cdp=None,
    # ad_block_on 的快捷方式/重复项。
    ad_block=None,
    # servername 的快捷方式/重复项。
    server=None,
    # guest_mode 的快捷方式/重复项。
    guest=None,
    # use_wire 的快捷方式/重复项。
    wire=None,
    # page_load_strategy 的快捷方式/重复项。
    pls=None,
):

常用driver 接口

method_summary.md

接口函数定义:

代码语言:javascript
复制
self.open(url)
# 打开指定的 URL。
# 其他命名方式: self.open_url(url), self.visit(url), visit_url(url), self.goto(url), self.go_to(url)

self.get(url)
# 如果参数是 URL,则执行 self.open(url)。
# 否则返回 self.get_element(URL_AS_A_SELECTOR)。

self.click(selector, by="css selector", timeout=None, delay=0, scroll=True)
# 点击指定的元素。

self.slow_click(selector, by="css selector", timeout=None)
# 缓慢点击指定的元素。

self.double_click(selector, by="css selector", timeout=None)
# 双击指定的元素。

self.context_click(selector, by="css selector", timeout=None)
# 右键点击指定的元素。
# 其他命名方式: self.right_click(selector, by="css selector", timeout=None)

self.click_chain(selectors_list, by="css selector", timeout=None, spacing=0)
# 按顺序点击一组元素。

self.type(selector, text, by="css selector", timeout=None)
# 在指定的元素中输入文本。
# 其他命名方式: self.update_text(selector, text, by="css selector", timeout=None), self.input(selector, text, by="css selector", timeout=None), self.fill(selector, text, by="css selector", timeout=None), self.write(selector, text, by="css selector", timeout=None)

self.send_keys(selector, text, by="css selector", timeout=None)
# 向指定的元素发送键盘输入。
# 其他命名方式: self.add_text(selector, text, by="css selector", timeout=None)

self.press_keys(selector, text, by="css selector", timeout=None)
# 向指定的元素发送键盘按键。

self.submit(selector, by="css selector")
# 提交指定的表单。

self.clear(selector, by="css selector", timeout=None)
# 清除指定元素的内容。

self.focus(selector, by="css selector", timeout=None)
# 聚焦到指定的元素。

self.refresh()
# 刷新当前页面。
# 其他命名方式: self.refresh_page(), self.reload_page(), self.reload()

self.get_current_url()
# 获取当前页面的 URL。

self.get_origin()
# 获取当前页面的原始 URL。

self.get_page_source()
# 获取当前页面的源代码。

self.get_title()
# 获取当前页面的标题。
# 其他命名方式: self.get_page_title()

self.get_user_agent()
# 获取浏览器的用户代理字符串。

self.get_locale_code()
# 获取浏览器的语言区域代码。

self.go_back()
# 导航到浏览器历史记录的上一页。

self.go_forward()
# 导航到浏览器历史记录的下一页。

self.open_start_page()
# 打开初始页面。

self.open_if_not_url(url)
# 如果当前 URL 不是指定的 URL,则打开它。

self.is_element_present(selector, by="css selector")
# 检查指定的元素是否存在。

self.is_element_visible(selector, by="css selector")
# 检查指定的元素是否可见。

self.is_element_clickable(selector, by="css selector")
# 检查指定的元素是否可点击。

self.is_element_enabled(selector, by="css selector")
# 检查指定的元素是否启用。

self.is_text_visible(text, selector="html", by="css selector")
# 检查指定的文本在元素中是否可见。

self.is_exact_text_visible(text, selector="html", by="css selector")
# 检查指定的精确文本在元素中是否可见。

self.is_non_empty_text_visible(selector="html", by="css selector")
# 检查指定的元素是否包含非空文本。

self.is_attribute_present(selector, attribute, value=None, by="css selector")
# 检查指定的元素是否具有指定的属性和值。

self.is_link_text_visible(link_text)
# 检查指定的链接文本是否可见。

self.is_partial_link_text_visible(partial_link_text)
# 检查指定的部分链接文本是否可见。

self.is_link_text_present(link_text)
# 检查指定的链接文本是否存在。

self.is_partial_link_text_present(link_text)
# 检查指定的部分链接文本是否存在。

self.get_link_attribute(link_text, attribute, hard_fail=True)
# 获取指定链接文本的属性值。
# 其他命名方式: self.get_link_text_attribute(link_text, attribute, hard_fail=True)

self.get_partial_link_text_attribute(link_text, attribute, hard_fail=True)
# 获取指定部分链接文本的属性值。

self.click_link(link_text, timeout=None)
# 点击指定的链接文本。
# 其他命名方式: self.click_link_text(link_text, timeout=None)

self.click_partial_link(partial_link_text, timeout=None)
# 点击指定的部分链接文本。
# 其他命名方式: self.click_partial_link_text(partial_link_text, timeout=None)

self.get_text(selector="html", by="css selector", timeout=None)
# 获取指定元素的文本内容。

self.get_attribute(selector, attribute, by="css selector", timeout=None, hard_fail=True)
# 获取指定元素的属性值。

self.set_attribute(selector, attribute, value, by="css selector", timeout=None, scroll=False)
# 设置指定元素的属性值。

self.set_attributes(selector, attribute, value, by="css selector")
# 设置多个元素的属性值。
# 其他命名方式: self.set_attribute_all(selector, attribute, value, by="css selector")

self.remove_attribute(selector, attribute, by="css selector", timeout=None)
# 移除指定元素的属性。

self.remove_attributes(selector, attribute, by="css selector")
# 移除多个元素的属性。

self.get_property(selector, property, by="css selector", timeout=None)
# 获取指定元素的属性值。

self.get_text_content(selector="html", by="css selector", timeout=None)
# 获取指定元素的文本内容。

self.get_property_value(selector, property, by="css selector", timeout=None)
# 获取指定元素的属性值。

self.get_image_url(selector, by="css selector", timeout=None)
# 获取指定图像元素的 URL。

self.find_elements(selector, by="css selector", limit=0)
# 查找所有匹配的元素。

self.find_visible_elements(selector, by="css selector", limit=0)
# 查找所有可见的匹配元素。

self.click_visible_elements(selector, by="css selector", limit=0, timeout=None)
# 点击所有可见的匹配元素。

self.click_nth_visible_element(selector, number, by="css selector", timeout=None)
# 点击第 N 个可见的匹配元素。

self.click_if_visible(selector, by="css selector", timeout=0)
# 如果元素可见则点击。

self.click_active_element()
# 点击当前活动元素。

self.click_with_offset(
    selector, x, y, by="css selector", mark=None, timeout=None, center=None)
# 点击元素的指定偏移位置。

self.double_click_with_offset(
    selector, x, y, by="css selector", mark=None, timeout=None, center=None)
# 双击元素的指定偏移位置。

self.is_checked(selector, by="css selector", timeout=None)
# 检查指定的复选框是否被选中。
# 其他命名方式: self.is_selected(selector, by="css selector", timeout=None)

self.check_if_unchecked(selector, by="css selector")
# 如果复选框未选中则选中。
# 其他命名方式: self.select_if_unselected(selector, by="css selector")

self.uncheck_if_checked(selector, by="css selector")
# 如果复选框被选中则取消选中。
# 其他命名方式: self.unselect_if_selected(selector, by="css selector")

self.is_element_in_an_iframe(selector, by="css selector")
# 检查指定元素是否在 iframe 中。

self.switch_to_frame_of_element(selector, by="css selector")
# 切换到包含指定元素的 iframe。

self.hover(selector, by="css selector", timeout=None)
# 悬停在指定元素上。
# 其他命名方式: self.hover_on_element(selector, by="css selector", timeout=None), self.hover_over_element(selector, by="css selector", timeout=None)

self.hover_and_click(
    hover_selector, click_selector,
    hover_by="css selector", click_by="css selector",
    timeout=None, js_click=False)
# 悬停在一个元素上然后点击另一个元素。

self.hover_and_js_click(
    hover_selector, click_selector,
    hover_by="css selector", click_by="css selector",
    timeout=None)
# 悬停在一个元素上然后使用 JavaScript 点击另一个元素。

self.hover_and_double_click(
    hover_selector, click_selector,
    hover_by="css selector", click_by="css selector",
    timeout=None)
# 悬停在一个元素上然后双击另一个元素。

self.drag_and_drop(
    drag_selector, drop_selector,
    drag_by="css selector", drop_by="css selector",
    timeout=None, jquery=False)
# 拖动一个元素并放置到另一个元素上。

self.drag_and_drop_with_offset(
    selector, x, y, by="css selector", timeout=None)
# 拖动元素到指定的偏移位置。

self.select_option_by_text(
    dropdown_selector, option, dropdown_by="css selector", timeout=None)
# 通过文本选择下拉选项。

self.select_option_by_index(
    dropdown_selector, option, dropdown_by="css selector", timeout=None)
# 通过索引选择下拉选项。

self.select_option_by_value(
    dropdown_selector, option, dropdown_by="css selector", timeout=None)
# 通过值选择下拉选项。

self.get_select_options(
    dropdown_selector, attribute="text", by="css selector", timeout=None)
# 获取下拉选项的属性值。

self.load_html_string(html_string, new_page=True)
# 加载 HTML 字符串。

self.set_content(html_string, new_page=False)
# 设置 HTML 内容。

self.load_html_file(html_file, new_page=True)
# 加载 HTML 文件。

self.open_html_file(html_file)
# 打开 HTML 文件。

self.execute_script(script, *args, **kwargs)
# 执行 JavaScript 脚本。

self.execute_cdp_cmd(script, *args, **kwargs)
# 执行 Chrome DevTools 协议命令。

self.execute_async_script(script, timeout=None)
# 执行异步 JavaScript 脚本。

self.safe_execute_script(script, *args, **kwargs)
# 安全执行 JavaScript 脚本。

self.get_gui_element_rect(selector, by="css selector")
# 获取 GUI 元素的矩形。

self.get_gui_element_center(selector, by="css selector")
# 获取 GUI 元素的中心点。

self.get_window_rect()
# 获取浏览器窗口的矩形。

self.get_window_size()
# 获取浏览器窗口的大小。

self.get_window_position()
# 获取浏览器窗口的位置。

self.set_window_rect(x, y, width, height)
# 设置浏览器窗口的矩形。

self.set_window_size(width, height)
# 设置浏览器窗口的大小。

self.set_window_position(x, y)
# 设置浏览器窗口的位置。

self.maximize_window()
# 最大化浏览器窗口。

self.switch_to_frame(frame="iframe", timeout=None)
# 切换到指定的 iframe。

self.switch_to_default_content()
# 切换到默认内容(退出 iframe)。

self.switch_to_parent_frame()
# 切换到父 iframe。

with self.frame_switch(frame, timeout=None):
    # 使用上下文管理器切换到指定的 iframe。

self.set_content_to_frame(frame, timeout=None)
# 设置内容到指定的 iframe。

self.set_content_to_default(nested=False)
# 设置内容到默认(退出 iframe)。
# 其他命名方式: self.set_content_to_default_content(nested=False)

self.set_content_to_parent()
# 设置内容到父 iframe。
# 其他命名方式: self.set_content_to_parent_frame()

self.open_new_window(switch_to=True)
# 打开新窗口。
# 其他命名方式: self.open_new_tab(switch_to=True)

self.switch_to_window(window, timeout=None)
# 切换到指定的窗口。
# 其他命名方式: self.switch_to_tab(tab, timeout=None)

self.switch_to_default_window()
# 切换到默认窗口。
# 其他命名方式: self.switch_to_default_tab()

self.switch_to_newest_window()
# 切换到最新的窗口。
# 其他命名方式: self.switch_to_newest_tab()

self.get_new_driver(
    browser=None,
    headless=None,
    locale_code=None,
    protocol=None,
    servername=None,
    port=None,
    proxy=None,
    proxy_bypass_list=None,
    proxy_pac_url=None,
    multi_proxy=None,
    agent=None,
    switch_to=True,
    cap_file=None,
    cap_string=None,
    recorder_ext=None,
    disable_js=None,
    disable_csp=None,
    enable_ws=None,
    enable_sync=None,
    use_auto_ext=None,
    undetectable=None,
    uc_cdp_events=None,
    uc_subprocess=None,
    log_cdp_events=None,
    no_sandbox=None,
    disable_gpu=None,
    headless2=None,
    incognito=None,
    guest_mode=None,
    dark_mode=None,
    devtools=None,
    remote_debug=None,
    enable_3d_apis=None,
    swiftshader=None,
    ad_block_on=None,
    host_resolver_rules=None,
    block_images=None,
    do_not_track=None,
    chromium_arg=None,
    firefox_arg=None,
    firefox_pref=None,
    user_data_dir=None,
    extension_zip=None,
    extension_dir=None,
    disable_features=None,
    binary_location=None,
    driver_version=None,
    page_load_strategy=None,
    use_wire=None,
    external_pdf=None,
    is_mobile=None,
    d_width=None,
    d_height=None,
    d_p_r=None,
)
# 获取新的 WebDriver 实例。

self.switch_to_driver(driver)
# 切换到指定的 WebDriver 实例。

self.switch_to_default_driver()
# 切换到默认的 WebDriver 实例。

self.save_screenshot(name, folder=None, selector=None, by="css selector")
# 保存当前页面的截图。

self.save_screenshot_to_logs(name=None, selector=None, by="css selector")
# 保存截图到日志。

self.save_data_to_logs(data, file_name=None)
# 保存数据到日志。

self.append_data_to_logs(data, file_name=None)
# 附加数据到日志。

self.save_page_source(name, folder=None)
# 保存页面源代码。

self.save_cookies(name="cookies.txt")
# 保存浏览器 cookies。

self.load_cookies(name="cookies.txt")
# 加载浏览器 cookies。

self.delete_all_cookies()
# 删除所有浏览器 cookies。
# 其他命名方式: self.clear_all_cookies()

self.delete_saved_cookies(name="cookies.txt")
# 删除保存的 cookies。

self.get_saved_cookies(name="cookies.txt")
# 获取保存的 cookies。

self.get_cookie(name)
# 获取指定名称的 cookie。

self.get_cookies()
# 获取所有 cookies。

self.add_cookie(cookie_dict)
# 添加单个 cookie。

self.add_cookies(cookies)
# 添加多个 cookies。

self.wait_for_ready_state_complete(timeout=None)
# 等待页面加载完成。

self.wait_for_angularjs(timeout=None)
# 等待 AngularJS 加载完成。

self.sleep(seconds)
# 暂停指定的秒数。
# 其他命名方式: self.wait(seconds)

self.install_addon(xpi_file)
# 安装浏览器插件。

self.activate_jquery()
# 激活 jQuery。

self.activate_demo_mode()
# 启用演示模式。

self.deactivate_demo_mode()
# 禁用演示模式。

self.activate_design_mode()
# 启用设计模式。

self.deactivate_design_mode()
# 禁用设计模式。

self.activate_recorder()
# 启用记录器。

self.save_recorded_actions()
# 保存记录的操作。

self.bring_active_window_to_front()
# 将活动窗口置于前台。

self.bring_to_front(selector, by="css selector")
# 将指定元素置于前台。

self.highlight_click(selector, by="css selector", loops=3, scroll=True, timeout=None)
# 高亮点击指定的元素。

self.highlight_type(selector, text, by="css selector", loops=3, scroll=True, timeout=None)
# 高亮输入文本到指定的元素。
# 其他命名方式: self.highlight_update_text(selector, text, by="css selector", loops=3, scroll=True, timeout=None)

self.highlight_if_visible(selector, by="css selector", loops=4, scroll=True)
# 如果元素可见则高亮。

self.highlight(selector, by="css selector", loops=4, scroll=True, timeout=None)
# 高亮指定的元素。

self.highlight_elements(selector, by="css selector", loops=4, scroll=True, limit=0)
# 高亮所有匹配的元素。

self.press_up_arrow(selector="html", times=1, by="css selector")
# 按上箭头键。

self.press_down_arrow(selector="html", times=1, by="css selector")
# 按下箭头键。

self.press_left_arrow(selector="html", times=1, by="css selector")
# 按左箭头键。

self.press_right_arrow(selector="html", times=1, by="css selector")
# 按右箭头键。

self.scroll_to(selector, by="css selector", timeout=None)
# 滚动到指定的元素。
# 其他命名方式: self.scroll_to_element(selector, by="css selector")

self.slow_scroll_to(selector, by="css selector", timeout=None)
# 缓慢滚动到指定的元素。
# 其他命名方式: self.slow_scroll_to_element(selector, by="css selector")

self.scroll_into_view(selector, by="css selector", timeout=None)
# 滚动到视图中的指定元素。

self.scroll_to_top()
# 滚动到页面顶部。

self.scroll_to_bottom()
# 滚动到页面底部。

self.click_xpath(xpath)
# 点击指定的 XPath 元素。

self.js_click(selector, by="css selector", all_matches=False, timeout=None, scroll=True)
# 使用 JavaScript 点击指定的元素。

self.js_click_if_present(selector, by="css selector", timeout=0)
# 如果元素存在则使用 JavaScript 点击。

self.js_click_if_visible(selector, by="css selector", timeout=0)
# 如果元素可见则使用 JavaScript 点击。

self.js_click_all(selector, by="css selector", timeout=None)
# 使用 JavaScript 点击所有匹配的元素。

self.jquery_click(selector, by="css selector", timeout=None)
# 使用 jQuery 点击指定的元素。

self.jquery_click_all(selector, by="css selector", timeout=None)
# 使用 jQuery 点击所有匹配的元素。

self.hide_element(selector, by="css selector")
# 隐藏指定的元素。

self.hide_elements(selector, by="css selector")
# 隐藏所有匹配的元素。

self.show_element(selector, by="css selector")
# 显示指定的元素。

self.show_elements(selector, by="css selector")
# 显示所有匹配的元素。

self.remove_element(selector, by="css selector")
# 移除指定的元素。

self.remove_elements(selector, by="css selector")
# 移除所有匹配的元素。

self.ad_block()
# 启用广告拦截。
# 其他命名方式: self.block_ads()

self.show_file_choosers()
# 显示文件选择器。

self.disable_beforeunload()
# 禁用 beforeunload 事件。

self.get_domain_url(url)
# 获取指定 URL 的域名。

self.get_active_element_css()
# 获取当前活动元素的 CSS。

self.get_beautiful_soup(source=None)
# 获取 BeautifulSoup 对象。

self.get_unique_links()
# 获取页面中的唯一链接。

self.get_link_status_code(link, allow_redirects=False, timeout=5, verify=False)
# 获取指定链接的状态码。

self.assert_link_status_code_is_not_404(link)
# 断言链接的状态码不是 404。

self.assert_no_404_errors(multithreaded=True, timeout=None)
# 断言页面中没有 404 错误。
# 其他命名方式: self.assert_no_broken_links(multithreaded=True, timeout=None)

self.print_unique_links_with_status_codes()
# 打印页面中唯一链接的状态码。

self.get_pdf_text(
    pdf, page=None, maxpages=None, password=None,
    codec='utf-8', wrap=False, nav=False, override=False, caching=True)
# 获取 PDF 文本。

self.assert_pdf_text(
    pdf, text, page=None, maxpages=None, password=None,
    codec='utf-8', wrap=True, nav=False, override=False, caching=True)
# 断言 PDF 文本。

self.create_folder(folder)
# 创建文件夹。

self.choose_file(selector, file_path, by="css selector", timeout=None)
# 选择文件上传。

self.save_element_as_image_file(selector, file_name, folder=None, overlay_text="")
# 保存元素为图像文件。

self.download_file(file_url, destination_folder=None)
# 下载文件。

self.save_file_as(file_url, new_file_name, destination_folder=None)
# 保存文件为指定名称。

self.save_data_as(data, file_name, destination_folder=None)
# 保存数据为文件。

self.append_data_to_file(data, file_name, destination_folder=None)
# 附加数据到文件。

self.get_file_data(file_name, folder=None)
# 获取文件数据。

self.get_downloads_folder()
# 获取下载文件夹路径。

self.get_browser_downloads_folder()
# 获取浏览器下载文件夹路径。

self.get_downloaded_files(regex=None, browser=False)
# 获取下载的文件。

self.get_path_of_downloaded_file(file, browser=False)
# 获取下载文件的路径。

self.get_data_from_downloaded_file(file, timeout=None, browser=False)
# 获取下载文件的数据。

self.is_downloaded_file_present(file, browser=False)
# 检查下载的文件是否存在。

self.is_downloaded_file_regex_present(regex, browser=False)
# 检查下载的文件是否匹配正则表达式。

self.delete_downloaded_file_if_present(file, browser=False)
# 如果存在则删除下载的文件。
# 其他命名方式: self.delete_downloaded_file(file, browser=False)

self.assert_downloaded_file(file, timeout=None, browser=False)
# 断言下载的文件存在。

self.assert_downloaded_file_regex(regex, timeout=None, browser=False)
# 断言下载的文件匹配正则表达式。

self.assert_data_in_downloaded_file(data, file, timeout=None, browser=False)
# 断言下载的文件包含指定数据。

self.assert_true(expr, msg=None)
# 断言表达式为真。

self.assert_false(expr, msg=None)
# 断言表达式为假。

self.assert_equal(first, second, msg=None)
# 断言两个值相等。

self.assert_not_equal(first, second, msg=None)
# 断言两个值不相等。

self.assert_in(first, second, msg=None)
# 断言第一个值在第二个值中。

self.assert_not_in(first, second, msg=None)
# 断言第一个值不在第二个值中。

self.assert_raises(*args, **kwargs)
# 断言引发指定的异常。

self.wait_for_attribute(selector, attribute, value=None, by="css selector", timeout=None)
# 等待元素的属性值。

self.assert_attribute(selector, attribute, value=None, by="css selector", timeout=None)
# 断言元素的属性值。

self.assert_title(title)
# 断言页面标题。

self.assert_title_contains(substring)
# 断言页面标题包含指定子字符串。

self.assert_url(url)
# 断言页面 URL。

self.assert_url_contains(substring)
# 断言页面 URL 包含指定子字符串。

self.assert_no_js_errors(exclude=[])
# 断言页面中没有 JavaScript 错误。

self.inspect_html()
# 检查页面 HTML。

self.is_valid_url(url)
# 检查 URL 是否有效。

self.is_online()
# 检查是否联网。

self.is_chromium()
# 检查是否是 Chromium 浏览器。

self.get_chrome_version()
# 获取 Chrome 浏览器版本。

self.get_chromium_version()
# 获取 Chromium 浏览器版本。

self.get_chromedriver_version()
# 获取 ChromeDriver 版本。

self.get_chromium_driver_version()
# 获取 ChromiumDriver 版本。

self.get_mfa_code(totp_key=None)
# 获取多因素认证代码。
# 其他命名方式: self.get_totp_code(totp_key=None), self.get_google_auth_password(totp_key=None), self.get_google_auth_code(totp_key=None)

self.enter_mfa_code(selector, totp_key=None, by="css selector", timeout=None)
# 输入多因素认证代码。
# 其他命名方式: self.enter_totp_code(selector, totp_key=None, by="css selector", timeout=None)

self.convert_css_to_xpath(css)
# 将 CSS 选择器转换为 XPath。

self.convert_xpath_to_css(xpath)
# 将 XPath 转换为 CSS 选择器。

self.convert_to_css_selector(selector, by)
# 转换为 CSS 选择器。

self.set_value(selector, text, by="css selector", timeout=None, scroll=True)
# 设置元素的值。

self.js_update_text(selector, text, by="css selector", timeout=None)
# 使用 JavaScript 更新元素的文本。
# 其他命名方式: self.js_type(selector, text, by="css selector", timeout=None), self.set_text(selector, text, by="css selector", timeout=None)

self.set_text_content(selector, text, by="css selector", timeout=None, scroll=False)
# 设置元素的文本内容。

self.jquery_update_text(selector, text, by="css selector", timeout=None)
# 使用 jQuery 更新元素的文本。
# 其他命名方式: self.jquery_type(selector, text, by="css selector", timeout=None)

self.get_value(selector, by="css selector", timeout=None)
# 获取元素的值。

self.set_time_limit(time_limit)
# 设置时间限制。

self.set_default_timeout(timeout)
# 设置默认超时时间。

self.reset_default_timeout()
# 重置默认超时时间。

self.fail(msg=None)
# 标记测试失败。

self.skip(reason="")
# 跳过测试。

self.start_recording_console_logs()
# 开始记录控制台日志。

self.console_log_string(string)
# 记录控制台日志字符串。

self.console_log_script(script)
# 记录控制台日志脚本。

self.get_recorded_console_logs()
# 获取记录的控制台日志。

self.set_local_storage_item(key, value)
# 设置本地存储项。

self.get_local_storage_item(key)
# 获取本地存储项。

self.remove_local_storage_item(key)
# 移除本地存储项。

self.clear_local_storage()
# 清除本地存储。
# 其他命名方式: delete_local_storage()

self.get_local_storage_keys()
# 获取本地存储的键。

self.get_local_storage_items()
# 获取本地存储的所有项。

self.set_session_storage_item(key, value)
# 设置会话存储项。

self.get_session_storage_item(key)
# 获取会话存储项。

self.remove_session_storage_item(key)
# 移除会话存储项。

self.clear_session_storage()
# 清除会话存储。
# 其他命名方式: delete_session_storage()

self.get_session_storage_keys()
# 获取会话存储的键。

self.get_session_storage_items()
# 获取会话存储的所有项。

self.set_wire_proxy(string)
# 设置代理,要求使用 "--wire"。

self.add_css_link(css_link)
# 添加 CSS 链接。

self.add_js_link(js_link)
# 添加 JavaScript 链接。

self.add_css_style(css_style)
# 添加 CSS 样式。

self.add_js_code_from_link(js_link)
# 从链接添加 JavaScript 代码。

self.add_js_code(js_code)
# 添加 JavaScript 代码。

self.add_meta_tag(http_equiv=None, content=None)
# 添加 meta 标签。

self.create_presentation(name=None, theme="default", transition="default")
# 创建演示文稿。

self.add_slide(
    content=None, image=None, code=None, iframe=None,
    content2=None, notes=None, transition=None, name=None)
# 添加幻灯片。

self.save_presentation(name=None, filename=None, show_notes=False, interval=0)
# 保存演示文稿。

self.begin_presentation(name=None, filename=None, show_notes=False, interval=0)
# 开始演示文稿。

self.create_pie_chart(
    chart_name=None, title=None, subtitle=None,
    data_name=None, unit=None, libs=True,
    labels=True, legend=True)
# 创建饼图。

self.create_bar_chart(
    chart_name=None, title=None, subtitle=None,
    data_name=None, unit=None, libs=True,
    labels=True, legend=True)
# 创建柱状图。

self.create_column_chart(
    chart_name=None, title=None, subtitle=None,
    data_name=None, unit=None, libs=True,
    labels=True, legend=True)
# 创建柱形图。

self.create_line_chart(
    chart_name=None, title=None, subtitle=None,
    data_name=None, unit=None, zero=False, libs=True,
    labels=True, legend=True)
# 创建折线图。

self.create_area_chart(
    chart_name=None, title=None, subtitle=None,
    data_name=None, unit=None, zero=False, libs=True,
    labels=True, legend=True)
# 创建面积图。

self.add_series_to_chart(data_name=None, chart_name=None)
# 添加数据系列到图表。

self.add_data_point(label, value, color=None, chart_name=None)
# 添加数据点到图表。

self.save_chart(chart_name=None, filename=None, folder=None)
# 保存图表。

self.display_chart(chart_name=None, filename=None, interval=0)
# 显示图表。

self.extract_chart(chart_name=None)
# 提取图表。

self.create_tour(name=None, theme=None)
# 创建导览。

self.create_shepherd_tour(name=None, theme=None)
# 创建 Shepherd 导览。

self.create_bootstrap_tour(name=None)
# 创建 Bootstrap 导览。

self.create_hopscotch_tour(name=None)
# 创建 Hopscotch 导览。

self.create_introjs_tour(name=None)
# 创建 Intro.js 导览。

self.set_introjs_colors(theme_color=None, hover_color=None)
# 设置 Intro.js 导览颜色。

self.add_tour_step(message, selector=None, name=None, title=None, theme=None, alignment=None)
# 添加导览步骤。

self.play_tour(name=None, interval=0)
# 播放导览。
# 其他命名方式: self.start_tour(name=None, interval=0)

self.export_tour(name=None, filename="my_tour.js", url=None)
# 导出导览。

self.activate_jquery_confirm()
# 启用 jQuery Confirm。

self.set_jqc_theme(theme, color=None, width=None)
# 设置 jQuery Confirm 主题。

self.reset_jqc_theme()
# 重置 jQuery Confirm 主题。

self.get_jqc_button_input(message, buttons, options=None)
# 获取 jQuery Confirm 按钮输入。

self.get_jqc_text_input(message, button=None, options=None)
# 获取 jQuery Confirm 文本输入。

self.get_jqc_form_inputs(message, buttons, options=None)
# 获取 jQuery Confirm 表单输入。

self.activate_messenger()
# 启用 Messenger。

self.post_message(message, duration=None, pause=True, style="info")
# 发送信息。

self.post_message_and_highlight(message, selector, by="css selector")
# 发送信息并高亮元素。

self.post_success_message(message, duration=None, pause=True)
# 发送成功信息。

self.post_error_message(message, duration=None, pause=True)
# 发送错误信息。

self.set_messenger_theme(theme="default", location="default", max_messages="default")
# 设置 Messenger 主题。

self.generate_referral(start_page, destination_page, selector=None)
# 生成推荐。

self.generate_traffic(start_page, destination_page, loops=1, selector=None)
# 生成流量。

self.generate_referral_chain(pages)
# 生成推荐链。

self.generate_traffic_chain(pages, loops=1)
# 生成流量链。

self.get_element(selector, by="css selector", timeout=None)
# 获取指定的元素。
# 其他命名方式: self.wait_for_selector(selector, by="css selector", timeout=None), self.locator(selector, by="css selector", timeout=None), self.wait_for_element_present(selector, by="css selector", timeout=None)

self.wait_for_query_selector(selector, by="css selector", timeout=None)
# 等待指定的查询选择器。

self.assert_element_present(selector, by="css selector", timeout=None)
# 断言元素存在。

self.assert_elements_present(*args, **kwargs)
# 断言多个元素存在。

self.find_element(selector, by="css selector", timeout=None)
# 查找指定的元素。
# 其他命名方式: self.wait_for_element(selector, by="css selector", timeout=None), self.wait_for_element_visible(selector, by="css selector", timeout=None)

self.assert_element(selector, by="css selector", timeout=None)
# 断言指定的元素。
# 其他命名方式: self.assert_element_visible(selector, by="css selector", timeout=None)

self.assert_elements(*args, **kwargs)
# 断言多个元素。
# 其他命名方式: self.assert_elements_visible(*args, **kwargs)

self.find_text(text, selector="html", by="css selector", timeout=None)
# 查找指定文本。
# 其他命名方式: self.wait_for_text(text, selector="html", by="css selector", timeout=None), self.wait_for_text_visible(text, selector="html", by="css selector", timeout=None)

self.find_exact_text(text, selector="html", by="css selector", timeout=None)
# 查找精确文本。
# 其他命名方式: self.wait_for_exact_text(text, selector="html", by="css selector", timeout=None), self.wait_for_exact_text_visible(text, selector="html", by="css selector", timeout=None)

self.find_non_empty_text(selector="html", by="css selector", timeout=None)
# 查找非空文本。
# 其他命名方式: self.wait_for_non_empty_text(selector="html", by="css selector", timeout=None), self.wait_for_non_empty_text_visible(selector="html", by="css selector", timeout=None)

self.assert_text(text, selector="html", by="css selector", timeout=None)
# 断言文本。
# 其他命名方式: self.assert_text_visible(text, selector="html", by="css selector", timeout=None)

self.assert_exact_text(text, selector="html", by="css selector", timeout=None)
# 断言精确文本。

self.wait_for_link_text_present(link_text, timeout=None)
# 等待链接文本出现。

self.wait_for_partial_link_text_present(link_text, timeout=None)
# 等待部分链接文本出现。

self.find_link_text(link_text, timeout=None)
# 查找链接文本。
# 其他命名方式: self.wait_for_link_text(link_text, timeout=None), self.wait_for_link_text_visible(link_text, timeout=None)

self.assert_link_text(link_text, timeout=None)
# 断言链接文本。
# 其他命名方式: self.assert_link(link_text, timeout=None)

self.find_partial_link_text(partial_link_text, timeout=None)
# 查找部分链接文本。
# 其他命名方式: self.wait_for_partial_link_text(partial_link_text, timeout=None)

self.assert_partial_link_text(partial_link_text, timeout=None)
# 断言部分链接文本。

self.wait_for_element_absent(selector, by="css selector", timeout=None)
# 等待元素消失。
# 其他命名方式: self.wait_for_element_not_present(selector, by="css selector", timeout=None)

self.assert_element_absent(selector, by="css selector", timeout=None)
# 断言元素消失。
# 其他命名方式: self.assert_element_not_present(selector, by="css selector", timeout=None)

self.wait_for_element_clickable(selector, by="css selector", timeout=None)
# 等待元素可点击。

self.wait_for_element_not_visible(selector, by="css selector", timeout=None)
# 等待元素不可见。

self.assert_element_not_visible(selector, by="css selector", timeout=None)
# 断言元素不可见。

self.wait_for_text_not_visible(text, selector="html", by="css selector", timeout=None)
# 等待文本不可见。

self.wait_for_exact_text_not_visible(text, selector="html", by="css selector", timeout=None)
# 等待精确文本不可见。

self.assert_text_not_visible(text, selector="html", by="css selector", timeout=None)
# 断言文本不可见。

self.assert_exact_text_not_visible(text, selector="html", by="css selector", timeout=None)
# 断言精确文本不可见。

self.assert_non_empty_text(selector="html", by="css selector", timeout=None)
# 断言非空文本。

self.wait_for_attribute_not_present(
    selector, attribute, value=None, by="css selector", timeout=None)
# 等待属性不存在。

self.assert_attribute_not_present(
    selector, attribute, value=None, by="css selector", timeout=None)
# 断言属性不存在。

self.accept_alert(timeout=None)
# 接受警报。
# 其他命名方式: self.wait_for_and_accept_alert(timeout=None)

self.dismiss_alert(timeout=None)
# 解散警报。
# 其他命名方式: self.wait_for_and_dismiss_alert(timeout=None)

self.switch_to_alert(timeout=None)
# 切换到警报。
# 其他命名方式: self.wait_for_and_switch_to_alert(timeout=None)

self.quit_extra_driver(driver=None)
# 退出额外的 WebDriver 实例。

self.check_window(name="default", level=0, baseline=False, check_domain=True, full_diff=False)
# 检查窗口状态。

self.deferred_assert_element(selector, by="css selector", timeout=None, fs=False)
# 延迟断言元素。
# 其他命名方式: self.delayed_assert_element(selector, by="css selector", timeout=None, fs=False)

self.deferred_assert_element_present(selector, by="css selector", timeout=None, fs=False)
# 延迟断言元素存在。
# 其他命名方式: self.delayed_assert_element_present(selector, by="css selector", timeout=None, fs=False)

self.deferred_assert_text(text, selector="html", by="css selector", timeout=None, fs=False)
# 延迟断言文本。
# 其他命名方式: self.delayed_assert_text(text, selector="html", by="css selector", timeout=None, fs=False)

self.deferred_assert_exact_text(
    text, selector="html", by="css selector", timeout=None, fs=False)
# 延迟断言精确文本。
# 其他命名方式: self.delayed_assert_exact_text(text, selector="html", by="css selector", timeout=None, fs=False)

self.deferred_assert_non_empty_text(
    selector="html", by="css selector", timeout=None, fs=False)
# 延迟断言非空文本。
# 其他命名方式: self.delayed_assert_non_empty_text(selector="html", by="css selector", timeout=None, fs=False)

self.deferred_check_window(
    name="default", level=0, baseline=False, check_domain=True, full_diff=False, fs=False)
# 延迟检查窗口状态。
# 其他命名方式: self.delayed_check_window(name="default", level=0, baseline=False, check_domain=True, full_diff=False, fs=False)

self.process_deferred_asserts(print_only=False)
# 处理延迟断言。
# 其他命名方式: self.process_delayed_asserts(print_only=False)

self.fail(msg=None)
# 标记测试失败。

self._check_browser()
# 检查浏览器状态。

self._print(TEXT)
# 打印文本。

使用示例:

代码语言:javascript
复制
driver.default_get(url)
# 使用默认方式获取 URL。

driver.open(url)
# 打开指定的 URL。

driver.click(selector)
# 点击指定的元素。

driver.click_link(link_text)
# 点击指定的链接文本。

driver.click_if_visible(selector)
# 如果元素可见则点击。

driver.click_active_element()
# 点击当前活动元素。

driver.send_keys(selector, text)
# 向指定的元素发送键盘输入。

driver.press_keys(selector, text)
# 向指定的元素发送键盘按键。

driver.type(selector, text)
# 在指定的元素中输入文本。

driver.submit(selector)
# 提交指定的表单。

driver.assert_element(selector)
# 断言指定的元素。

driver.assert_element_present(selector)
# 断言元素存在。

driver.assert_element_not_visible(selector)
# 断言元素不可见。

driver.assert_text(text, selector)
# 断言文本。

driver.assert_exact_text(text, selector)
# 断言精确文本。

driver.find_element(selector)
# 查找指定的元素。

driver.find_elements(selector)
# 查找所有匹配的元素。

driver.wait_for_element(selector)
# 等待指定的元素。

driver.wait_for_element_visible(selector)
# 等待元素可见。

driver.wait_for_element_present(selector)
# 等待元素存在。

driver.wait_for_selector(selector)
# 等待选择器。

driver.wait_for_text(text, selector)
# 等待文本。

driver.wait_for_exact_text(text, selector)
# 等待精确文本。

driver.wait_for_and_accept_alert()
# 等待并接受警报。

driver.wait_for_and_dismiss_alert()
# 等待并解散警报。

driver.is_element_present(selector)
# 检查元素是否存在。

driver.is_element_visible(selector)
# 检查元素是否可见。

driver.is_text_visible(text, selector)
# 检查文本是否可见。

driver.is_exact_text_visible(text, selector)
# 检查精确文本是否可见。

driver.is_attribute_present(selector, attribute)
# 检查属性是否存在。

driver.get_text(selector)
# 获取元素的文本内容。

driver.js_click(selector)
# 使用 JavaScript 点击元素。

driver.get_active_element_css()
# 获取当前活动元素的 CSS。

driver.get_locale_code()
# 获取语言区域代码。

driver.get_origin()
# 获取原始 URL。

driver.get_user_agent()
# 获取用户代理字符串。

driver.highlight(selector)
# 高亮指定的元素。

driver.highlight_click(selector)
# 高亮并点击指定的元素。

driver.highlight_if_visible(selector)
# 如果元素可见则高亮。

driver.sleep(seconds)
# 暂停指定的秒数。

driver.locator(selector)
# 获取选择器。

driver.get_attribute(selector, attribute)
# 获取元素的属性值。

driver.get_page_source()
# 获取页面源代码。

driver.get_title()
# 获取页面标题。

driver.switch_to_frame(frame="iframe")
# 切换到指定的 iframe。

driver.get(url)
# 获取指定的 URL。

driver.uc_open(url)
# 在 undetected-chromedriver 模式下打开 URL。

driver.uc_open_with_tab(url)
# 在新标签页中打开 URL。

driver.uc_open_with_reconnect(url, reconnect_time=None)
# 打开 URL 并重新连接。

driver.uc_open_with_disconnect(url, timeout=None)
# 打开 URL 并断开连接。

driver.reconnect(timeout)
# 重新连接。

driver.disconnect()
# 断开连接。

driver.connect()
# 连接。

driver.uc_click(selector)
# 使用 undetected-chromedriver 点击元素。

driver.uc_gui_press_key(key)
# 使用 PyAutoGUI 按下键盘键。

driver.uc_gui_press_keys(keys)
# 使用 PyAutoGUI 按下键盘键列表。

driver.uc_gui_write(text)
# 使用 PyAutoGUI 输入文本。

driver.uc_gui_click_x_y(x, y, timeframe=0.25)
# 使用 PyAutoGUI 点击屏幕上的指定位置。

driver.uc_gui_click_cf(frame="iframe", retry=False, blind=False)
# 使用 PyAutoGUI 点击 CF Turnstile。

driver.uc_gui_handle_cf(frame="iframe")
# 使用 PyAutoGUI 处理 CF Turnstile。

driver.uc_switch_to_frame(frame="iframe")
# 使用 undetected-chromedriver 切换到指定的 iframe。

最后的话

我在写一个基于selenium和seleniumbase的浏览器控制的库,以便在需要使用selenium时候能够快速开始,而不需要每次都重复造轮子。欢迎提PR。

虽然seleniumbase实际上是一个已经封装过了的库,但其功能非常强大,以至于可能我并不需要这么多功能(我是在找隐藏指纹时候找到这个的,因为原始的uc库忽然用不了了)。更多的,我可能需要的是多个工具或者兼容性的适配。所以,有必要另外再自己写一个。

​https://github.com/songxf1024/selenium_browser

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 前景提要
  • driver = Driver()
  • 常用driver 接口
  • 最后的话
相关产品与服务
测试服务
测试服务 WeTest 包括标准兼容测试、专家兼容测试、手游安全测试、远程调试等多款产品,服务于海量腾讯精品游戏,涵盖兼容测试、压力测试、性能测试、安全测试、远程调试等多个方向,立体化安全防护体系,保卫您的信息安全。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档