Python Selenium获取具有相同类的多个图像并保存它 - 腾讯云开发者社区

使用Selenium进行测试自动化已使全球的网站测试人员能够轻松执行自动化的网站测试。Webdriver是Selenium框架的核心组件，您可以使用它执行自动跨浏览器测试针对不同类型的浏览器（例如Google Chrome，Mozilla Firefox，Safari，Opera，Internet Explorer，Microsoft Edge等）访问您的网站或Web应用程序。与其他Web自动化工具/框架相比，使用Selenium Webdriver执行测试自动化的主要优势是支持多种编程语言，例如Python，Java，C，Ruby，PHP，JavaScript，.Net，Perl，Groovy等。

爬虫系列（9）爬虫的多线程理论以及动态数据的获取方法。

将将要爬去的url放在一个队列中，这里使用标准库Queue。访问url后的结果保存在结果队列中

您找到你想要的搜索结果了吗？

是的

没有找到

「Python爬虫系列讲解」十二、基于图片爬取的 Selenium 爬虫

真香用这七大Python效率工具

为了提高效率，我们在平时工作中常会用到一些Python的效率工具，Python作为比较老的编程语言，它可以实现日常工作的各种自动化。为了更便利的开发项目，这里给大家推荐几个Python的效率工具。

Part3-2.获取高质量的阿姆斯特丹建筑立面图像（补档）

（补档，建议点击底部阅读原文跳转到我的博客阅读）本文为《通过深度学习了解建筑年代和风格》论文复现的第三部分——获取阿姆斯特丹高质量街景图像的下篇，主要是介绍如何用Python的selenium库去操控浏览器截取谷歌街景图像，并按照Pytorch中标准ImageFolder保存，最后使用语义分割模型进行进一步筛选图片。

Part3-2.获取高质量的阿姆斯特丹建筑立面图像（补档）

如何轻松爬取网页数据？

【爬虫】python+selenium+tesseract

最近工作中的爬虫小知识，主要是python+selenium自动化截图以及tesseract的验证码自动校验（其实tesseract的正确率很差）。

《权力的游戏》最终季上线！谁是你最喜爱的演员？这里有一份Python教程 | 附源码

《权力的游戏》最终季已于近日开播，对于全世界翘首以待的粉丝们来说，其最大的魅力就在于“无法预知的人物命运”。那些在魔幻时代的洪流中不断沉浮的人们，将会迎来怎样的结局？近日，来自 Medium 上的一位名叫 Rocky Kev 的小哥哥利用 Python 通过《权力的游戏》粉丝网站收集最喜爱演员的照片。结果是怎样的是其次的，关键是过程，用他的话来讲，“非常 enjoy！”

真香用这八大Python效率工具

Python 基于 selenium 实现不同商城的商品价格差异分析系统

selenium 原本是一款自动化测试工具，因其出色的页面数据解析和用户行为模拟能力而常用于爬虫程序中，致使爬虫程序的爬取过程更简单、快捷。

python-- 爬虫之用Selenium做爬虫

框架底层使用JavaScript模拟真实用户对浏览器进行操作。测试脚本执行时，浏览器自动按照脚本代码做出点击，输入，打开，验证等操作，就像真实用户所做的一样，从终端用户的角度测试应用程序。使浏览器兼容性测试自动化成为可能，尽管在不同的浏览器上依然有细微的差别。使用简单，可使用Java，Python等多种语言编写用例脚本。

使用Python轻松抓取网页

抓取网页入门其实挺简单的。在之前的文章中我们介绍了怎么用C#和JAVA两种方法来抓取网页，这一期给大家介绍一种更容易，也是使用最广泛的一种抓取方法，那就是Python。

自动滑块验证码识别_滑块验证码原理

有爬虫，自然就有反爬虫，就像病毒和杀毒软件一样，有攻就有防，两者彼此推进发展。而目前最流行的反爬技术验证码，为了防止爬虫自动注册，批量生成垃圾账号，几乎所有网站的注册页面都会用到验证码技术。其实验证码的英文为 CAPTCHA（Completely Automated Public Turing test to tell Computers and Humans Apart），翻译成中文就是全自动区分计算机和人类的公开图灵测试，它是一种可以区分用户是计算机还是人的测试，只要能通过 CAPTCHA 测试，该用户就可以被认为是人类。由此也可知道激活成功教程滑块验证码的关键即是让计算机更好的模拟人的行为，这也是激活成功教程的难点所在。（注：本文18年所作，仅作参考）

web自动化之selenium的特殊用法汇总篇

selenium.webdriver.remote.webelement — Selenium 4.1.0 documentation

如何利用Selenium实现数据抓取

网络数据抓取在当今信息时代具有重要意义，而Python作为一种强大的编程语言，拥有丰富的库和工具来实现网络数据的抓取和处理。本教程将重点介绍如何使用Selenium这一强大的工具来进行网络数据抓取，帮助读者更好地理解和掌握Python爬虫技术。

在 Python 中使用 Selenium 打开链接

使用 Selenium 打开链接的最简单方法是使用 WebDriver 对象的 get（）方法。此方法指示浏览器导航到指定的 URL。

Selenium+2Captcha 自动化+验证码识别实战

本文深入探讨了使用Selenium库进行网页自动化操作，并结合2Captcha服务实现ReCAPTCHA验证码的破解。内容涵盖Selenium的基础知识、验证码的分类、2Captcha服务的使用，以及通过实例进行的详细讲解，最后对实践进行总结和优化思考，为读者提供了一条完整的验证码破解实践路线图。

用 Python 登录主流网站，我们的数据爬取少不了它

项目地址：https://github.com/CriseLYJ/awesome-python-login-model

python爬虫的常见方式

a.urllib/requests/selenium+chrome/selenium+phantomjs设置代理

GitHub 热门：各大网站的 Python 爬虫登录汇总

项目地址：https://github.com/CriseLYJ/awesome-python-login-model

selenium 模拟滑块验证码

slider-captcha/slider_captcha.py at master · maxnoodles/slider-captcha (github.com)

Selenium自动化工具集 - 完整指南和使用教程

Selenium 是一个用于自动化浏览器操作的工具集。它通过模拟用户在浏览器中的行为，如点击、输入、表单提交等，来实现自动化测试和网页数据抓取等功能。Selenium 针对不同的浏览器提供了不同的 WebDriver 接口，如 ChromeDriver、GeckoDriver（Firefox）、WebDriver（Safari）等。

爬虫模拟移动

爬虫的一大难点就是破解验证码。验证码大致上分为文字识别、滑动、文字点击、图像识别等，本文讲的是其中的滑动验证码

《手把手教你》系列练习篇之8-python+ selenium自动化测试 -压台篇（详细教程）

本文是练习篇的最后一篇文章，虽然练习篇的文章到此就要和大家说拜拜了，但是我们的学习之路才刚刚开始。不要停下你的脚步，大步朝前走吧！比你优秀的人还在走着，我们有什么理由停下自己的脚步了，生命不止，学习亦是如此。好了，宏哥的毒鸡汤好

《手把手教你》系列练习篇之6-python+ selenium自动化测试（详细教程）

前面文章我们了解了如何获取元素的text属性值，和判断元素是否显示在页面（is_displayed()方法），本文我们来学习下，判断一个控件是否被选中状态、获取页面元素的大小、组合键-全选文字、组合键-退格键删除文本和鼠标右键等练习的内容。

python 模拟移动

1 - 需要用到前面两篇文章的参数，图像对比得出缺口左上角的横坐标，然后使用轨迹移动算法，获取轨迹列表

Selenium与PhantomJS

Selenium是一个Web的自动化测试工具，最初是为网站自动化测试而开发的，类型像我们玩游戏用的按键精灵，可以按指定的命令自动操作，不同是Selenium 可以直接运行在浏览器上，它支持所有主流的浏览器（包括PhantomJS这些无界面的浏览器）。

Selenium入门

查看chrom浏览器的版本,需要下载其对应版本的chrome webdriver.

基于 selenium 实现网站图片采集

一般情况下可以通过 selenium 来批量获取图片，定位元素，获取URL ，逻辑相对简单:

scrapy_selenium的常见问题和解决方案

scrapy_selenium是一个结合了scrapy和selenium的库，可以让我们使用selenium的webdriver来控制浏览器进行动态网页的爬取。但是在使用scrapy_selenium的过程中，我们可能会遇到一些问题，比如如何设置代理、如何处理反爬、如何优化性能等。本文将介绍一些scrapy_selenium的常见问题和解决方案，希望对你有所帮助。

GitHub 热门：各大网站的 Python 爬虫登录汇总

项目地址：https://github.com/CriseLYJ/awesome-python-login-model

初学web自动化测试--笔记1

web driver 是可以直接操作浏览器的driver, 根据不同的浏览器，需要不同的driver,下面列出了一些可用的web driver的镜像地址： chrom浏览器的web driver（chromedriver.exe）：http://npm.taobao.org/mirrors/chromedriver/ firefox（火狐浏览器）的web driver （geckodriver.exe）：https://github.com/mozilla/geckodriver/releases IE(IEDriverServer_Win32_3.9.0.zip 是32位的3.9.0 driver): http://selenium-release.storage.googleapis.com/index.html web自动化测试中，可以通过webdriver的API，向浏览器发送相应的request, 然后实现自动测试，比如自动点击，自动填写，自动滚动，自动切换窗口/标签页等。但是如上所述，不同的浏览器有不同的web driver. 那么自然也就有不同的API提供，所以对于同一个功能，那么就需要基于不同的driver,学习不同的API,这操作起来，岂不是头疼？在python中，我们只需要按照如下导入webdriver, 就可以轻松用一种方式来应付各种不同的web driver了:

这9个提高效率的Python工具，太赞了！

最近汇总了平时常用到的9个很好的Python工具，它们能极大的提高我们的工作效率，安装它们，然后逐步熟练使用它们。若有用，可以收藏这篇文章。

知识点讲解四：selenium教程

环境： Python3.6.5 编译器： Sublime Text 3 联系方式： ke.zb@qq.com 第三方库： seleniu

（数据科学学习手札50）基于Python的网络数据采集-selenium篇（上）

接着几个月之前的（数据科学学习手札31）基于Python的网络数据采集（初级篇），在那篇文章中，我们介绍了关于网络爬虫的基础知识（基本的请求库，基本的解析库，CSS，正则表达式等），在那篇文章中我们只介绍了如何利用urllib、requests这样的请求库来将我们的程序模拟成一个请求网络服务的一端，来直接取得设置好的url地址中朴素的网页内容，再利用BeautifulSoup或pyspider这样的解析库来对获取的网页内容进行解析，在初级篇中我们也只了解到如何爬取静态网页，那是网络爬虫中最简单的部分，事实上，现在但凡有价值的网站都或多或少存在着自己的一套反爬机制，例如利用JS脚本来控制网页中部分内容的请求和显示，使得最原始的直接修改静态目标页面url地址来更改页面的方式失效，这一部分，我在（数据科学学习手札47）基于Python的网络数据采集实战（2）中爬取马蜂窝景点页面下蜂蜂点评区域用户评论内容的时候，也详细介绍过，但之前我在所有爬虫相关的文章中介绍的内容，都离不开这样的一个过程：

如何使用Selenium WebDriver查找错误的链接？

当您在网站上遇到404 /页面未找到/无效超链接时，会想到什么想法？啊！当您遇到损坏的超链接时，您会感到烦恼，这是为什么您应继续专注于消除Web产品（或网站）中损坏的链接的唯一原因。您可以使用Selenium WebDriver来利用自动化进行錯誤的链接测试，而无需进行人工检查。

Selenium常见元素定位方法和操作的学习介绍

为爬虫框架构建Selenium模块、DSL模块(Kotlin实现)

NetDiscover是一款基于Vert.x、RxJava2实现的爬虫框架。我最近添加了两个模块：Selenium模块、DSL模块。

博客园自动发帖--图像处理极验验证码

为了写这篇文章，先写了两篇爬虫cookies详解和selenium+requests进行cookies保存读取操作，感兴趣的朋友可以看看前两篇文章。

Selenium获取网页源码

Python+Selenium可以做网络爬虫。所以，我们可以从网页源码中爬出想要的信息。

selenium模拟浏览器&PhantomJS

注意:最新版本的selenium停止对PhantomJS的支持(可以使用谷歌&火狐的无头浏览器)，如果还想用PhantomJS，需要对selenium降级

Python常用包，可以学学这9个

最近汇总了平时常用到的9个很好的Python包，它们能极大的提高我们的工作效率，安装它们，然后逐步熟练使用它们。若有用，可以收藏这篇文章。 1 Faker生成假数据你若还在为生成名字、地址、IP地址而发愁，试试Faker库吧。它是专业生成假数据的神器，但生成的数据看起来又如此“不假”。基本用法如下所示： from faker import Faker fake = Faker(locale="zh_CN") fake.name() # '谭柳' fake.address() #

Selenium vs. Playwright

在现代Web应用程序开发中，自动化浏览器测试成为了不可或缺的一部分。为了使测试更加高效、可靠，我们需要使用一些工具，例如Selenium和Playwright。这两个工具都是基于Python的自动化测试框架，本文将介绍它们的原理、架构、优劣对比以及代码实例。

如何使用Python的Selenium库进行网页抓取和JSON解析

随着互联网的快速发展，网页抓取和数据解析在许多行业中变得越来越重要。无论是电子商务、金融、社交媒体还是市场调研，都需要从网页中获取数据并进行分析。Python的Selenium库作为一种自动化测试工具，已经成为许多开发者的首选，因为它提供了强大的功能和灵活性。本文将介绍如何使用Python的Selenium库进行网页抓取，并结合高效JSON解析的实际案例，帮助读者解决相关问题。

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐