多个Selenium实例的Scrapy (并行)_如何并行运行Selenium-scrapy_并行运行多个EA实例 - 腾讯云开发者社区

python、selenium、scrapy

我需要用Selenium和Scrapy抓取很多网址。为了加快整个过程，我正在尝试创建一组共享的Selenium实例。我的想法是，如果需要，让一组并行Selenium实例可用于任何Request，如果需要，则提供released。我试图创建一个Middleware，但问题是Middleware是顺序的(我看到所有的驱动程序(我称之为浏览器)都在加载urls，而且似乎是顺序的)。我希望所有的驱动程序<e

浏览 84提问于2019-01-23得票数 0

1回答

抓取-动态等待页面加载- selenium + Scrapy

python、selenium、web-scraping、scrapy

我花了平均每页1.35秒的时间下载内容。1) scrapy是否以paralel自动运行多个url请求？2)如何使用scrapy设置动态超时，如Selenium的WebDriverWait

浏览 5提问于2017-09-18得票数 3

回答已采纳

1回答

Python Scrapy - Selenium -请求下一页

python、selenium、scrapy

然后，在进入下一页之前，它应该获得所有指向列出的文章的链接。问题是它总是从第一个url ("")抓取，而不是遵循我给它的url。为什么下面的代码不能从我在reqeusts中传递的新urls中抓取？我没主意了.from scrapy.http.request import Requestfrom selenium.webdriver.comm

浏览 2提问于2017-06-14得票数 1

1回答

如何使Selenium与Scrapy并行运行？

python、selenium、scrapy

我试着用Scrapy和Selenium来刮一些urls。有些urls由Scrapy直接处理，而其他urls则首先使用Selenium处理。问题是: Selenium在处理url时，Scrapy没有并行处理其他url。它等待work驱动程序完成它的工作。我尝试在不同的进程中使用不同的init参数(使用多处理池)来，但是我得到了twisted.internet.error.ReactorNotRestartable。请告

浏览 5提问于2020-04-13得票数 3

回答已采纳

1回答

抓取跟随javascript输入按钮

xpath、web-scraping、scrapy、scrapy-spider

type="submit">类GetData显示一些可点击的图标我已经尝试了下面的代码，只是看看是否有scrapy跟随输入，但没有成功。links = sel.xpath("//input[@class='GetData']"

浏览 1提问于2016-01-21得票数 3

回答已采纳

1回答

在Selenium Grid上注册幻影on节点

selenium、selenium-webdriver、phantomjs、selenium-grid

我已经使用多个chrome实例在Selenium上并行运行了我的测试。如何设置Selenium，使我可以使用多个幻影实例来运行测试，而不是使用chrome。

浏览 1提问于2017-06-02得票数 0

回答已采纳

1回答

我能在java的父选项卡和子选项卡中并行运行测试吗？(硒TestNG )

java、selenium、testing、testng

我有一个场景可以并行运行两个不同的测试来验证位置。我的要求是在两个选项卡中运行。每个选项卡是完全独立的。我能否使用driver.getHandles()实现这一点？

浏览 2提问于2020-05-15得票数 0

1回答

如何并行运行Selenium-scrapy

python、selenium、web-scraping、scrapy、multiprocessing

我正在尝试使用scrapy和selenium来抓取javascript网站。我使用selenium和一个chrome驱动程序打开javascript网站，使用scrapy从当前页面抓取到不同列表的所有链接，并将它们存储在一个列表中(到目前为止，这是最好的方法，因为尝试使用seleniumRequest理想情况下，我会让selenium驱动程序并行打开链接，如下所示： How can I make Selenium run in par

浏览 36提问于2021-02-05得票数 0

回答已采纳

1回答

Selenium运行Firefox驱动程序，用于不使用

python、selenium、scrapy

我使用了的火狐驱动程序来加载和废弃项目中的一些蜘蛛中的网页。问题：Selenium只在运行已在webdriver.Firefox()中使用的蜘蛛时才运行Firfox实例。为什么这很重要？在蜘蛛完成后，我将退出Firefox实例，但在不使用Selenium

浏览 3提问于2016-12-10得票数 2

回答已采纳

1回答

Selenium中的并行自动化

performance、selenium、parallel-processing、automation

我对Selenium还不熟悉。我怀疑的是，提前谢谢。快乐编码:)

浏览 7提问于2020-02-13得票数 0

2回答

scrapy中的Selenium不起作用

python、python-2.7、selenium、selenium-webdriver、scrapy

我有一个scrapy Crawlspider，它可以很好地解析链接并返回html内容。然而，对于javascript页面，我使用Selenium来访问“隐藏”内容。问题是，虽然Selenium可以在简陋的解析之外工作，但它不能在parse_items函数内部工作from scrapy<

浏览 3提问于2016-06-16得票数 0

5回答

Selenium支持多线程吗？

multithreading、testing、selenium、webdriver

Selenium支持多线程吗？ Thread.Sleep(5000); } 希望问题是清楚的。

浏览 1提问于2012-03-16得票数 5

回答已采纳

1回答

如何在两台不同的机器上实现机器人框架并行测试执行？

java、selenium、robotframework、selenium-grid

我正在使用RobotFramework和selenium2library实现web应用程序的自动化。我尝试过并行执行。如果我在一台机器上并行运行3个实例，那么它正在运行。但是我想在不同的机器上运行它，因为我已经尝试了以下代码：-java -jar <selenium.jar> -role hub (可选端口f.e.此主机可用于se

浏览 1提问于2018-07-05得票数 2

1回答

刮擦爬虫占用大量CPU

python-2.7、scrapy、web-crawler、cpu-usage、scrapyd

我有多个蜘蛛在多个实例中并行运行。它们都在使用几乎100%的cpu使用率。我搜索了解决方案并找到了这个页面提前感谢

浏览 6提问于2014-10-15得票数 2

回答已采纳

6回答

尝试并行地使用Selenium实现自动化，但多个webdriver实例崩溃了

selenium、parallel-processing、webdriver、phantomjs

因此，我正在尝试创建一个java程序，它使用Selenium自动化WebDriver来执行网站上的任务。目前，我正在将它用于工作，以便自动化一个恼人的任务，即用户必须将文件上传到我们的数据库。我已经成功地制作了一个自动化的程序，并为自己节省了几个小时的手工工作。现在我正在尝试让程序在parallel中运行多个浏览器。我已经用我的程序的一个更简单的版本测试了这一点，并通过使用自己的WebDriver

浏览 89提问于2013-06-26得票数 16

3回答

Scrapy是单线程还是多线程？

python、multithreading、scrapy、web-crawler

在Scrapy中几乎没有并发设置，比如。这是否意味着Scrapy crawler是多线程的？所以如果我运行scrapy crawl my_crawler，它会同时并行地触发多个请求吗？我问这个是因为，我读到过Scrapy是单线程的。

浏览 0提问于2014-07-15得票数 17

1回答

在无头模式下用firefox改进抓取和硒

python、selenium、scrapy、firefox-headless

我正在抓取一个javascript重站点，我已经设置了一个流浪实例来检查可行性( 1GB RAM )。系统在解析了几个urls之后就崩溃了。我无法确定此设置的内存需求和崩溃原因。然而，我让htop并行运行，并在系统崩溃前获得了屏幕截图，如下所示。我怀疑记忆是不够的，但我不知道我需要多少。因此，我希望：替代

浏览 3提问于2018-01-25得票数 0

1回答

用硒爬行而不是刮刮

python、selenium、selenium-webdriver、web-scraping、scrapy

我已经阅读了所有使用scrapy对AJAX页面进行抓取的线程，并安装了selenium来简化任务，我的爬行器可以部分爬行，但不能将任何数据输入到我的项目中。页面上使用xpath: //div[@id="a_NMContent/ text ()") import scra

浏览 4提问于2014-12-20得票数 5

1回答

使用scrapy* splash对抓取速度有显著影响吗？*

python、selenium、web-scraping、scrapy、scrapy-splash

到目前为止，我一直在使用scrapy和编写自定义类来处理使用ajax的网站。但是，如果我使用scrapy-splash，据我所知，它会在javascript之后抓取呈现的html，爬虫的速度会受到严重影响吗？使用scrapy抓取一个普通的html页面所需的时间与使用scrapy-splash抓取javascript渲染的html所需的时间进行了怎样的比较？最后，scrapy

浏览 3提问于2018-04-18得票数 12

回答已采纳

1回答

使用WebDriverandGrid2并行执行RSpec测试

ruby、rspec、parallel-processing、webdriver

WebdriverParallel GUI自动化工具：Grid2脚本语言:RubyBDD工具: Rspecdef set_up Assert.new(@driver).verify_text_present("My Dashboard")步骤：启动中心使用java -jar selenium-server-staalone2.3.0.jar

浏览 4提问于2012-05-09得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云