开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

python selenium网络抓取。` Mistake `循环中的错误。如何使代码等待页面加载并重试

在Python中使用Selenium进行网络抓取时，有时会遇到循环中的错误，即页面加载未完成导致的问题。为了解决这个问题，可以使用显式等待和重试机制。

显式等待：使用Selenium的WebDriverWait类，设置一个最大等待时间，直到某个条件满足或超时为止。常用的条件包括元素可见、元素存在、元素可点击等。以下是一个示例代码：

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

driver = webdriver.Chrome()
driver.get("https://example.com")

try:
    element = WebDriverWait(driver, 10).until(
        EC.presence_of_element_located((By.ID, "myElement"))
    )
    # 执行需要等待的操作
    # ...
except:
    # 处理超时异常
    # ...

driver.quit()

在上述代码中，WebDriverWait类会等待最多10秒，直到ID为"myElement"的元素出现在页面中。如果超过10秒仍未出现，将抛出超时异常。

重试机制：通过循环和异常处理来实现重试。当页面加载未完成时，捕获异常并进行重试操作，直到页面加载完成或达到最大重试次数。以下是一个示例代码：

from selenium import webdriver
from selenium.common.exceptions import TimeoutException

driver = webdriver.Chrome()
driver.get("https://example.com")

max_retries = 3
retry_count = 0
loaded = False

while not loaded and retry_count < max_retries:
    try:
        # 执行需要等待的操作
        # ...
        loaded = True  # 页面加载完成
    except TimeoutException:
        # 处理超时异常
        retry_count += 1
        # 等待一段时间后重试
        # ...

driver.quit()

在上述代码中，通过设置最大重试次数和重试计数器，当页面加载未完成时，捕获超时异常并进行重试操作。当页面加载完成或达到最大重试次数时，退出循环。

以上是解决循环中的错误的两种常用方法，可以根据具体情况选择适合的方式来使代码等待页面加载并重试。

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

爬虫篇 | 快速入门selenium（十一）

Selenium是一个用于web自动化测试的工具，Selenium测试直接运行在浏览器中，就好像一个真正的用户在操作一样。

01

Selenium常用的元素等待方法

日常的UI自动化测试，单步调试的时候元素可以定位到，并且可以正常操作，但是在跑测试案例流程的时候反而报错。这时就需要考虑是否界面的切换，或者功能的跳转缓慢导致元素未加载完成就执行了操作，所以我们需要加上元素等待。WebDriver提供了几种类型的等待：强制等待、显式等待和隐式等待。

02

爬虫之Selenium的等待及定位

关于昨天的机器学习文章，希望能够亲自码一下，将会学到很多东西，如果觉得很好，欢迎转发，谢谢！有关翻译贡献，可点击公众号右下角联系我，备注：翻译，或者昨日文章的阅读原文，pr到仓库中来！关于今天的爬虫文章，则是一篇之前练习爬虫碰到的问题解决策略，希望可以帮助大家，下面一起来看吧，欢迎留言与转发！

03

python selenium2示例 - 同步机制

前言在使用python selenium2进行自动化测试实践的过程中，经常会遇到元素定位不到，弹出框定位不到等等各种定位不到的情况，在大多数的情况下，无非是以下两种情况： 1、有frame存在，定位前，未switch到对应的frame内 2、元素未加载完毕（从界面看已经显示），但DOM树还在load状态或在加载js 那对于这类情况，怎么解决呢？通俗的讲法：等待。高大上点：解决自动化测试代码与浏览器加载渲染之间的同步问题。下面我们分段讲述各种处理方式：一强制等待这种方式简单粗暴直接有效，不

04

Selenium自动化测试-设置元素等待

使用sleep，需先导入time模块，import time, 然后使用time.sleep()来让程序等待多久。

01

Selenium自动化测试-设置元素等待

使用sleep，需先导入time模块，import time, 然后使用time.sleep()来让程序等待多久。

02

爬虫杀手锏-PhantomJS(附案列网站模拟登录豆瓣网)

Selenium：可以根据我们的指令，让浏览器自动加载页面，获取需要的数据，甚至页面截屏，或者判断网站上某些动作是否发生。Selenium 自己不带浏览器，不支持浏览器的功能，它需要与第三方浏览器结合在一起才能使用。但是我们有时候需要让它内嵌在代码中运行，所以我们可以用一个叫 PhantomJS 的工具代替真实的浏览器。

02

Selenium必须掌握的元素定位方法

Web端的UI自动化测试，目前使用比较多的就是Python+Selenium。当前一些UI自动化测试工具也是基于Selenium做开发的。最近经常有童鞋后台询问selenium元素定位方法，其实网上学习资料很多，只要你肯动手，都可以搜的到。元素定位对于自动化测试来说是比较重要而且繁琐的一件事。接下来就来讲一下如何使用webdriver提供的基本元素定位方法。再次声明：本站点已经和百度、必应、谷歌等各大搜索引擎达成长期的战略合作协议，你有任何疑问都可以通过以上公司提供的免费服务得到解答。

02

Python selenium — 一定要会用selenium的等待，三种等待方式解读

很多人在群里问，这个下拉框定位不到、那个弹出框定位不到…各种定位不到，其实大多数情况下就是两种问题：1 有frame，2 没有加等待。殊不知，你的代码运行速度是什么量级的，而浏览器加载渲染速度又是什么量级的，就好比闪电侠和凹凸曼约好去打怪兽，然后闪电侠打完回来之后问凹凸曼你为啥还在穿鞋没出门？凹凸曼分分中内心一万只羊驼飞过，欺负哥速度慢，哥不跟你玩了，抛个异常撂挑子了。

01

Selenium Python使用技巧（三）

在Selenium自动化测试中网页可能需要花费一些时间来加载，或者希望在触发测试代码之前可以看到页面上的特定Web元素。在这种情况下，需要执行“显式等待”，这是一段代码，通过它可以定义要发生的条件，然后再继续执行代码。

03

《手把手教你》系列练习篇之9-python+ selenium自动化测试 -番外篇 - 最后一波

本来上一篇就是练习篇的最后一篇文章了，但是有的小伙伴私下反映说是做了那么多练习，没有一个比较综合的demo练练手。因此宏哥在这里又补存了一些常见的知识点进行练习，在文章最后也通过实例给小伙伴们或者童鞋们进行了一个登录模块的自动化测试的实例，其他的你可以照猫画虎地轻松的搞定和实现。

04

selenium&appium中的三种等待方式---基于python

我们在实际使用selenium或者appium时，等待下个等待定位的元素出现，特别是web端加载的过程，都需要用到等待，而等待方式的设置是保证脚本稳定有效运行的一个非常重要的手段，在selenium中（appium通用）常用的等待分为显示等待WebDriverWait()、隐式等待implicitly_wait()、强制等待sleep()三种，下面我们就分别介绍一下这三种等待的区别

02

四、请求库之selenium模块

一介绍 selenium最初是一个自动化测试工具,而爬虫中使用它主要是为了解决requests无法直接执行JavaScript代码的问题 selenium本质是通过驱动浏览器，完全模拟浏览器的操作，比如跳转、输入、点击、下拉等，来拿到网页渲染之后的结果，可支持多种浏览器 from selenium import webdriver browser=webdriver.Chrome() browser=webdriver.Firefox() browser=webdriver.PhantomJS() b

05

深入selenium三种等待方式使用

from selenium.webdriver.support.wait import WebDriverWait

03

常用selenium浏览器配置

selenium webdriver在get()方法会一直等待页面加载完毕才会执行后面的，可如果加载时间太长会导致后续操作无法进行。有时我们要的信息已经加载出来了，再继续加载网页就没有意义了。可以通过set_page_load_time()方法来设定时间然后捕获TimeoutException异常，并通过执行Javascript来停止页面加载 window.stop()

02

selenium 的显示等待与隐式等待

现在很多的网页都采用了 Ajax 技术，那么采用一般的静态爬虫技术会出现抓取不到页面的元素。比如歌曲的主页会有评论数量，一般评论数量是动态加载的。所以这就涉及到selenium,支持各种浏览器，包括Chrome，Safari，Firefox 等主流界面式浏览器，如果你在这些浏览器里面安装一个 Selenium 的插件，那么便可以方便地实现Web界面的测试。

04

腾讯云上Selenium用法示例

00

Python Selenium的使用（爬虫）

Selenium的使用 14 /10 周一阴 1 动态渲染页面爬取对于访问Web时直接响应的数据（就是response内容可见），我们使用urllib、requests或Scrapy框架爬取。

01

Python+Selenium笔记（十）：元素等待机制

（一）前言突然的资源受限或网络延迟，可能导致找不到目标元素，这时测试报告会显示测试失败。这时需要一种延时机制，来使脚本的运行速度与程序的响应速度相匹配，WebDriver为这种情况提供了隐式等待和显式等待两种机制。（二）隐式等待一旦设置隐式等待时间，就会作用于这个WebDriver实例的整个生命周期（对所有的元素查找都生效），设置隐式等待时间后，Webdriver会在一定时间内持续检测和搜寻DOM，以便于查找一个或多个不是立即加载成功并可用的元素。隐式等待的默认时间是0. WebDriver使用

05

Appium+PythonUI自动化之webdriver的三种等待方式（强制等待、隐式等待、显示等待）

在自动化测试脚本的运行过程中，webdriver操作浏览器的时候，对于元素的定位是有一定的超时时间，大致应该在1-3秒的样子，如果这个时间内仍然定位不到元素，就会抛出异常，中止脚本执行。我们可以通过在脚本中设置等待的方式来避免由于网络延迟或浏览器卡顿导致的偶然失败，常用的等待方式有三种：一、强制等待 time.sleep(5)

02

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭