开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

Selenium PhantomJS保存屏幕截图未获得正确的页面

Selenium是一个自动化测试工具，PhantomJS是一个无界面的浏览器，可以通过Selenium来控制PhantomJS进行网页截图。然而，有时候使用Selenium和PhantomJS进行页面截图时，可能会遇到未获得正确页面的问题。

这个问题可能由以下几个方面引起：

版本兼容性问题：Selenium和PhantomJS都有不同的版本，可能存在兼容性问题。建议使用最新版本的Selenium和PhantomJS，并确保它们之间的兼容性。
页面加载时间过长：如果页面加载时间过长，可能导致截图时页面还未完全加载完成。可以尝试增加等待时间，确保页面加载完成后再进行截图。
JavaScript渲染问题：PhantomJS使用WebKit引擎进行页面渲染，但有些页面可能使用了复杂的JavaScript代码，可能导致渲染不完全或出现错误。可以尝试禁用或修改页面中的JavaScript代码，或者使用其他浏览器引擎进行渲染。
页面结构问题：有些页面可能存在特殊的结构或布局，可能导致截图时出现问题。可以尝试调整页面结构或布局，或者使用其他截图方法，如使用浏览器插件或其他截图工具。

推荐的腾讯云相关产品：腾讯云云服务器（CVM）和腾讯云云函数（SCF）。

腾讯云云服务器（CVM）是一种弹性、安全可靠的云计算服务，提供了多种配置和操作系统选择，可以满足不同场景的需求。您可以在腾讯云官网了解更多关于腾讯云云服务器的信息：https://cloud.tencent.com/product/cvm

腾讯云云函数（SCF）是一种无服务器计算服务，可以帮助您快速构建和部署应用程序，无需关心服务器管理和运维。您可以在腾讯云官网了解更多关于腾讯云云函数的信息：https://cloud.tencent.com/product/scf

相关搜索:PhantomJS时间线屏幕截图重复相同的图像 Python:获取和保存屏幕截图的最快方法 Python，使用PhantomJS的多屏幕截图 Selenium + Python。元素的屏幕截图比元素小 Selenium -屏幕截图的滚动 selenium remote webdriver屏幕截图捕获颜色不正确 Selenium Webdriver -使用Robot捕获屏幕截图中的URL Selenium Webdriver未将屏幕截图保存到目录 selenium脚本的屏幕截图 Selenium，Safari:只拍摄可见元素的屏幕截图

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

使用 selenium 写的多进程全网页截图工具，发现了 PhantomJS 截图的 bug

当然，还有今天要说的，可以使用 selenium 来作为全网页截图工具。...不过，我在使用 selenium 作为全网页截图的过程中，发现了 PhantomJS 的一个“bug”，具体的情况后面详细讲解。...2、启动工具脚本，会使用多进程批量进行网页截图，截图后的图片保存在当前目录下 pics 文件夹下面，如果这个文件夹不存在则会自动创建。...webshot(tup) 函数这个函数就是这个工具最主要的函数，所做的事情是先读取文件，然后使用 selenium 去启动无头浏览器 PhantomJS 来进行整个网页的截图。...PhantomJS 浏览器是因为据我了解，其他的浏览器比如谷歌和火狐都只能但屏幕截图，无法做到整个网页的截图。

9542 0

实现完整网页保存为图片的方法

因为有些网页内容是联网异步获取的，所以爬虫保存html页面的方式无法保证后续数据与此前的一致性，因此将网页内容以图片保存下来，是一种简单而直接的思路。...screenshot.js命令，则会将js中指定的url页面内容生成图片并保存在指定的位置。...Python实现 Python中结合selenium和PhantomJS可以轻松实现页面全图截取，代码DEMO演示如下： from selenium import webdriver import os...在python中通过执行js语句，计算出网页真实的width和height值，然后对页面resize操作使其展示全部大小，之后再进行截图就可以保存整个网页了。...受网速、webkit渲染CPU占用、页面内容大小、IO读写等多方因素影响，其单线程页面图片抓取的速度并不高（在笔记本上DEMO测试的时候，百度等小页面1s以内完成，门户财经相关新闻网站页面很大，加载完成并截图保存耗时

2.7K1 0

利用 Python + Selenium 实现对页面的指定元素截图(可截长图元素)

在保证截图质量的情况下，速度较慢方式三针对WebDriver.PhantomJS 由于接口实现的差异，PhantomJS相比于Chrome，可以截取到整个网页。...解决图片加载不完整的问题参考: 利用 Python + Selenium 自动化快速截图我们先在首页上执行一段 JavaScript 脚本，将页面的滚动条拖到最下方，然后再拖回顶部，最后才截图。...比如说会动态变化的验证码。本来 Selenium 也提供了对元素截图的支持，只要在选中的元素上调用其 screenshot() 方法即可。...所以，只能曲线救国，利用 Selenium 执行JS代码，将页面上不需要的元素一一删除，只保留我们希望留下的元素，然后再利用上面的窗口截屏功能。...WebDriver.PhantomJS截图可以获取整个页面的长图。

9.5K4 1

Python爬虫之数据提取-selenium的介绍

运行效果展示 Selenium是一个Web的自动化测试工具，最初是为网站自动化测试而开发的，Selenium 可以直接调用浏览器，它支持所有主流的浏览器（包括PhantomJS这些无界面的浏览器），可以接收指令...，让浏览器自动加载页面，获取需要的数据，甚至页面截屏等。...，69版本以上的谷歌浏览器将无法使用截图功能 # driver.save_screenshot("itcast.png") print(driver.title) # 打印页面的标题 # 退出模拟浏览器...1.2 phantomjs无界面浏览器的运行效果 PhantomJS 是一个基于Webkit的“无界面”(headless)浏览器，它会把网站加载到内存并执行页面上的 JavaScript。...点击notes.txt进入版本说明页面 ? 查看chrome和chromedriver匹配的版本 ? 根据操作系统下载正确版本的chromedriver ?

1.4K2 0

python+selenium+PhantomJS抓取网页动态加载内容

环境搭建准备工具：pyton3.5,selenium,phantomjs 我的电脑里面已经装好了python3.5 安装Selenium pip3 install selenium 安装Phantomjs...按照系统环境下载phantomjs,下载完成之后，将phantomjs.exe解压到python的script文件夹下使用selenium+phantomjs实现简单爬虫 from selenium...driver.page_source #获取网页文本 driver.save_screenshot('1.png') #截图保存 print(data) driver.quit() selenium...#加载网页 data = driver.page_source #获取网页文本 driver.save_screenshot('1.png') #截图保存 print(data) driver.quit...() 请求超时设置 webdriver类中有三个和时间相关的方法： 1.pageLoadTimeout 设置页面完全加载的超时时间，完全加载即完全渲染完成，同步和异步脚本都执行完 2.setScriptTimeout

2K1 0

orbital angular momentum_omnidirectional

安装Selenium Ubuntu下安装Selenium Selenium使用浏览器的支持　选择合适的浏览器 PhantomJS Windows下安装PhantomJS 这里强烈建议使用迅雷下载浏览器下载速度太慢了...获取cookie 使用Chrome或者FireFox登录网站，截图第一次请求的request headers. 其中的cookie和request是我们需要的内容....使用程序将help函数保存到一个txt文件： import sys from selenium import webdriver browser = webdriver.PhantomJS() out...，网站在防盗链上做的很到位，只要在页面上执行一次刷新操作，网站就判断为盗链，显示出防盗链的图片，并且得到的图片地址也无法下载，这里最简单的方法就是对整个页面截图。...Selenium本身带有截图工具。　创建工程在eclipse下创建getCartoon工程.

1.1K6 0

腾讯云上PhantomJS用法示例

页面加载可以利用 phantom 来实现页面的加载，下面的例子实现了页面的加载并将页面保存为一张图片。...page.render('example.png'); } phantom.exit(); }); 首先创建了一个webpage对象，然后加载本站点主页，判断响应状态，如果成功，那么保存截图为...因为 PhantomJS 使用了 WebKit内核，是一个真正的布局和渲染引擎，它可以像屏幕截图一样捕获一个web界面。...因为 PhantomJS 可以加载和操作一个web页面，所以用来自动化处理也是非常适合的。...不要急，后面会有 Python 和 PhantomJS 的综合使用的。相关推荐腾讯云上Selenium用法示例腾讯云主机Python3环境安装PySpider爬虫框架过程

3.1K1 0

web自动化测试(2):选择selenium优势？与PhantomJSQTPMonkey对比

通过Monkey程序模拟用户触摸屏幕、滑动Trackball、按键等操作，向系统发送伪随机的用户事件流（点击、滑动、Application切换、横竖屏、应用关闭），从而对设备上的程序进行压力测试，检测程序多久的时间会发生异常...页面自动化操作：使用标准的DOM API或一些JavaScript框架（如jQuery）访问和操作Web页面。屏幕捕获：以编程方式抓起CSS、SVG和Canvas等页面内容，即可实现网络爬虫应用。...构建服务端Web图形应用，如截图服务、矢量光栅图应用。网络监控：自动进行网络性能监控、跟踪页面加载情况以及将相关监控的信息以标准的HAR格式导出。...现在用的最多还是数据页面截屏及监控。用它做测试比较少。 PhantomJS VS Selenium Selenium是 ThoughtWorks专门为Web应用程序编写的一个验收测试工具。...如下图所示：之所以引入这个代理 Remote Control Server 是因为“同源策略”的限制，通过这个代理服务器来“欺骗”远程 Server，达到使其以为是从同一个地方 load 代码以正确返回请求数据的效果

1.7K2 0

dotnet使用Selenium执行自动化任务

自动化测试工具：Selenium Selenium是一个用于Web应用程序测试的工具。Selenium测试直接运行在浏览器中，就像真正的用户在操作一样。...支持的浏览器包括 ,Chrome,Firefox,IE,PhantomJS(一个基于webkit内核的无界面浏览器)等。.../docs/api/dotnet/ 在.net framework下Selenium的使用新建解决方案，控制台项目添加NuGet包：Selenium.WebDriver 3.5.1 Selenium.Support...3.5.1 通过NuGet下载Phantomjs或者手动下载驱动，设置环境变量 Selenium.PhantomJS.WebDriver //无头浏览器无界面 Selenium.Chrome.WebDriver...简单使用示例使用PhantomJS驱动保存百度首页截图 var driver = new PhantomJSDriver();//创建浏览器 driver.Navigate().GoToUrl

8141 0

Headless Chrome简介

PDF --print-to-pdf 标志将页面转出为PDF 文件： chrome --headless --disable-gpu --print-to-pdfhttps://www.baidu.com.../ 使用Headless Chrome截图要捕获页面的屏幕截图，请使用--screenshot 标志： chrome --headless --disable-gpu--screenshot...在Headless出现之前，主要流行的是PhantomJS这个库，原理是模拟成一个实际的浏览器去加载网站。Headless Chome出现之后，PhantomJS地位开始不保。...毕竟Headless Chome本身是一个真正的浏览器，支持所有chrome特性，而PhantomJS只是模拟，因此Headless Chome更具优势，下面是使用Python Selenium调用Headless...：sudo add-apt-repository -r ppa:user/ppa-name 　　然后进入 /etc/apt/sources.list.d 目录，将相应 ppa 源的保存文件删除。

1.5K1 0

selenium和phantomJS

大家好，又见面了，我是你们的朋友全栈君。 selenium和phantomJS 目录清单 [x] . selenium和phantomjs概述 [x] . selenium常用API [x] ....csdn登录网页 * 填写账号、密码，点击登录 * 进入CSDN主页 selenium配合phantomjs完成登录操作，并保存数据到文件中 # coding:utf-8 from selenium.../phantomjs-2.1.1/bin/phantomjs") # 访问登录页面 driver.get("https://passport.csdn.net/account/login?...ref=toolbar") # 保存登录页面截图 driver.save_screenshot("csdn1.png") # 获取登录用户输入框、密码输入框 u_name = driver.find_element_by_id...**") # 模拟点击登录 login_btn = driver.find_element_by_css_selector("#fm1 .logging") login_btn.click() # 保存登录后的截图

7572 0

Selenium | 笔记

driver.execute_script("return document.documentElement.scrollHeight") driver.set_window_size(width, height) # 保存截图...driver.execute_script("return document.documentElement.scrollHeight") driver.set_window_size(width, height) # 保存截图.../articles/' + title + '.pdf') 由于如果打开同一个网站的多个页面并保存pdf，那么很可能就会出现由于网站title相同而覆盖的情况，所以每次保存完毕后，改一下pdf的文件名。...: unknown error: cannot find Chrome binary 解决: 未正确安装 Chrome, 如果还是保存, 则手动指定 var options = new ChromeOptions...// 只要正确安装的就不需要指定 //options.BinaryLocation = ""; OpenQA.Selenium.WebDriverArgumentException: invalid

2.7K4 1

16、web爬虫讲解2—PhantomJS虚拟浏览器+selenium模块操作PhantomJS

PhantomJS虚拟浏览器 phantomjs 是一个基于js的webkit内核无头浏览器也就是没有显示界面的浏览器，利用这个软件，可以获取到网址js加载的任何信息，也就是可以获取浏览器异步加载的信息...] 然后将PhantomJS文件夹里的bin文件夹添加系统环境变量 [image] cdm 输入命令：PhantomJS 出现以下信息说明安装成功 [image] selenium模块是一个python...操作PhantomJS软件的一个模块 selenium模块PhantomJS软件 webdriver.PhantomJS()实例化PhantomJS浏览器对象 get('url')访问网站 find_element_by_xpath...('截图保存路径名称')将网页截图，保存到此目录 page_source获取网页htnl源码 quit()关闭PhantomJS浏览器 #!.../") #访问网址 # time.sleep(3) #等待3秒 # llqdx.get_screenshot_as_file('H:/py/17/img/123.jpg') #将网页截图保存到此目录

1.1K0 0

Phantomjs的正确打开方式

经过网友的提醒，发现其实是使用phantomjs的方法出了问题，因此无论怎么优化，都不能从根本上去提升性能。那么本篇就来好好说说，Phantomjs正确的打开方式。...抛弃selenium+phantomjs 　　之前我一直使用selenium去使用phantomjs，原因是因为selenium封装了phantomjs一部分功能，selenium又提供了python的接口模块...然而，我现在要说的是，是时候抛弃selenium+phantomjs了，原因之一此封装的接口很久没有更新了（没人维护了），原因之二selenium只实现了一部分phantomjs功能，且很不完善。　　...Phantomjs正确使用方式正确打开方式应该使用phantomjs Webservice作为一种web服务的形式（api）,将其与其他语言分离开来（比如python）。...运行截图运行python以后，异步下发10个任务，Phantomjs服务器端接收到url并开始处理，并发处理10个任务并输入结果。

98610 0

2018-06-06selenium和phantomJS

selenium和phantomJS ——编辑：大牧莫邪目录清单 [x] . selenium和phantomjs概述 [x] . selenium常用API [x] ....登录网页填写账号、密码，点击登录进入CSDN主页 selenium配合phantomjs完成登录操作，并保存数据到文件中 # coding:utf-8 from selenium import webdriver.../phantomjs-2.1.1/bin/phantomjs") # 访问登录页面 driver.get("https://passport.csdn.net/account/login?...ref=toolbar") # 保存登录页面截图 driver.save_screenshot("csdn1.png") # 获取登录用户输入框、密码输入框 u_name = driver.find_element_by_id...**") # 模拟点击登录 login_btn = driver.find_element_by_css_selector("#fm1 .logging") login_btn.click() # 保存登录后的截图

7241 0

爬虫0050：selenium & phantomJS 无界神器selenium和phantomJS

selenium和phantomJS 目录清单 selenium和phantomjs概述 selenium常用API 案例操作：模拟登陆csdn 课程内容 1. selenium和phantomJS是什么东西...登录网页填写账号、密码，点击登录进入CSDN主页 selenium配合phantomjs完成登录操作，并保存数据到文件中 # coding:utf-8 from selenium import webdriver.../phantomjs-2.1.1/bin/phantomjs") # 访问登录页面 driver.get("https://passport.csdn.net/account/login?...ref=toolbar") # 保存登录页面截图 driver.save_screenshot("csdn1.png") # 获取登录用户输入框、密码输入框 u_name = driver.find_element_by_id...**") # 模拟点击登录 login_btn = driver.find_element_by_css_selector("#fm1 .logging") login_btn.click() # 保存登录后的截图

1K1 0

实战干货：从零快速搭建自己的爬虫系统

python selenium 安装：pip install selenium phantomjs 下载地址：http://phantomjs.org/download.html 这里附上简单的应用示例代码...这里我们仍然可以使用 phantomjs 来完成，原理就是使用浏览器对渲染后的页面进行整页截图。实现的原理也比较简单，使用 js 代码，控制浏览器直接以图片形式渲染网页，之后保存。...这个命令的含义是使用 phantomjs 运行 rasterize.js 渲染 my_html.html 并将结果保存到 tmp.png 中。 $ phantomjs rasterize.js ..../tmp.png 生成截图的过程中有**可能遇到的坑**，在这里也提一下，希望后来的同学不会再因为这个问题浪费时间：首先，控制 phantomjs 进行截图的时候，有可能截图不完整，这是因为网页有一个动画绘制的过程...1、pyspider 使用 phantomjs 抓取页面时发现，当请求量较大，会存在 phantomjs 有大量链接未关闭，从而停止响应。

11.2K4 1

常用selenium浏览器配置

1.限制页面加载时间 selenium webdriver在get()方法会一直等待页面加载完毕才会执行后面的，可如果加载时间太长会导致后续操作无法进行。...修改PhantomJS的User-Agent from selenium import webdriver from selenium.webdriver.common.desired_capabilities...PhantomJS无图模式 PhantomJS官网中给出了一些PhantomJS的设置参数（点我查看）。...亲测都有效，按理说根据PhantomJS的参数说明直接修改service_args中的proxy参数就能实现ip代理，代码也比较精简易读，不过实际运行时无法返回正确信息。...函数、区域截图等等。

2.5K2 0

.NET Core+Selenium+Github+Travis CI => SiteHistory

前言总是三分钟热度的我折腾了一个可以每天自动截取指定网站页面并保存到Github的项目SiteHistory，感觉挺好(每次都这样 ? )。想知道YouTube今天的首页长啥样么？...Selenium:一个用于Web应用程序测试的工具。Selenium测试直接运行在浏览器中，就像真正的用户在操作一样。结合phantomjs等驱动可以实现页面自动化。...]页面的截图名称为[baidu.jpg] dotnet run baidu https://www.baidu.com/ png 指定图片类型为png dotnet run baidu https...download-test 下载的图片保存到download-test文件夹下 dotnet run baidu https://www.baidu.com/ jpg 10 download-test...需要引入Nuget包为：CoreCompat.Selenium.WebDriver 配置中的变量按照此文章配置即可亲测搭配travis-ci食用最佳，Fork之后，前往travis-ci配置即可

8991 0

爬虫系列（9）爬虫的多线程理论以及动态数据的获取方法。

Selenium 可以根据我们的指令，让浏览器自动加载页面，获取需要的数据，甚至页面截屏，或者判断网站上某些动作是否发生。...PhantomJS PhantomJS 是一个基于Webkit的“无界面”(headless)浏览器，它会把网站加载到内存并执行页面上的 JavaScript，因为不会展示图形界面，所以运行起来比完整的浏览器要高效...) # 打印页面标题 "百度一下，你就知道" print（driver.title） # 生成当前页面快照并保存 driver.save_screenshot("baidu.png") # id=...NO·3 Selenium 处理滚动条 Selenium 处理滚动条 selenium并不是万能的，有时候页面上操作无法实现的，这时候就需要借助JS来完成了　　当页面上的元素超过一屏后，想操作屏幕下方的元素...这时候需要借助滚动条来拖动屏幕，使被操作的元素显示在当前的屏幕上。滚动条是无法直接用定位工具来定位的。

2.4K3 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭