首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

一次性搞定微博,苏生不惑又写了个脚本

PDF ,打开https://weibo.com/musiclijian ,点击右上角开始拉取该用户可见的微博内容,然后用 Chrome浏览器 的导出 PDF功能合成pdf。...最后生成的pdf文件: 除了这个chrome扩展还可以用这个油猴脚本导出微博内容 https://github.com/Chilfish/Weibo-archiver,安装油猴脚本后设置时间范围,是否下载原图...开始备份: 抓取后直接导出pdf,效果: 备份微博收藏可以用这个油猴脚本,它能备份微博收藏,发布和点赞,备份以页单位,每页20条,可以输入框设置自已需要备份的页面范围,默认会下载全部数据,防止保存文件过大...,对备份数据分文件保存,默认10页存一个文件,备份图片清晰度分为3个等级,等级越大图片越大越清晰,备份完成后,数据自动保存到本地,下载格式包含html文件和图片资源的 zip 压缩包,解压后使用谷歌浏览器打开...规则类型选择修改请求,匹配类型选正则表达式 ,规则为.*\.sinaimg.cn,头名称为referer,内容https://weibo.com 然后浏览器输入图片网址就可以访问了https:/

67120

Headless Testing入坑指南

●抓取数据更加方便 如果没有无测试工具的话,抓取页面数据,你需要打开一个浏览器,输入页面地址,找到指定的页面数据。而有了无测试工具之后,这一切操作都可以自动化完成。...Headless Chrome Headless Chrome环境下运行Chrome浏览器的一种方式,最终达到帮助开发者完成自动化测试的目的。目前Chrome 59以上已经支持运行。...你可以利用Headless Chrome将页面转换为pdf 你可以Headless Chrome对页面进行截屏 就像你看到的一样,Headless Chrome是通过命令行的方式来与浏览器进行交互。...总结 本文中,我们了解了无测试如何帮助作为开发者的你,并探索了一些测试工具和示例。 测试web开发中是非常有用的工具。...通过测试,您可以生成网站的截图和pdf文件,从网站上抓取内容,自动提交表单,并模拟键盘输入。 当与浏览器结合使用时,它允许你完全成熟的浏览器中做任何你可以做的事情,而不需要浏览器。

1.7K50
您找到你想要的搜索结果了吗?
是的
没有找到

使用 Google Chrome 浏览器命令行导出网页 PDF 文件

开发过程中,我们经常需要将网页内容导出 PDF 文件。传统方法如使用 wkhtmltopdf 工具虽然方便,但在 CSS 兼容性方面存在一些问题。...幸运的是,Google Chrome 浏览器提供了一种更为强大和兼容性更好的方式来实现这一功能,即通过命令行使用其模式(Headless mode)来导出网页 PDF 文件。...使用命令行导出网页 PDF安装好 Google Chrome 浏览器后,我们可以利用其提供的模式(Headless mode)功能通过命令行导出网页 PDF 文件。...=file.pdf https://zqb.baimuv.com/ht.html解释一下这个命令中的各个参数:--headless: 启用模式,无需 GUI 环境即可运行。...--print-to-pdf: 指定输出的 PDF 文件名和路径。最后一个参数是需要导出 PDF 的网页 URL。

49610

Puppeteer Sharp: 使用C#和Headless Chrome爬网页

Puppeteer API 的便利性是能够使用浏览器的特性,而不需要把浏览器显示出来,以此提高性能。 Why use Puppeteer Sharp?...如果您是 .NET 开发人员,通过 Nuget 包安装到项目中可以实现: 使用 Web 浏览器抓取 Web 使用测试框架自动测试Web 应用程序 检索 JavaScript 呈现的 HTML 现代...image.png 首先我们需要下载Chrome浏览器到本地。这是Puppeteer Sharp将使用与网站交互的浏览器。 幸运的是,我们可以使用 C# 下载默认修订版或开发人员指定的修订版。...仅当本地计算机上不存在该修订版本,才会下载。...image.png 浏览器中成功加载网页后,让我们通过搜索本地旅游景点与网页进行交互: // Search for a local tourist attraction on Bing Maps

5.6K20

Puppeteer介绍

可以使用Puppeteer来自动化完成浏览器的操作,官方给出的一些使用场景如下: 生成页面PDF 抓取 SPA(单页应用)并生成预渲染内容(即“SSR”(服务器端渲染)) 自动提交表单,进行 UI 测试...另外,他们各自的API使用风格上也相差很多。 实践案例 使用Puppeteer之前需要先安装,Node.js最低版本要求:Node v6.4.0。...有2种方式安装: 第一种:执行npm i puppeteer安装,这种方式安装同时会下载最新版本的Chromium,以保证可以使用API。...{ // puppeteer默认打开的浏览器模式 // const browser = await puppeteer.launch(); // 通过参数明确指定puppeteer...不以模式打开浏览器,并指定Chrome浏览器可执行文件的路径 const browser = await puppeteer.launch({headless: true, executablePath

1.4K20

Google Chrome Headless (网页保存为PDF、网页截图)

.rpm 二、指定网页打印成PDF google-chrome --headless --disable-gpu --no-sandbox --print-to-pdf=gen.pdf http://www.google.com...--no-sandbox ,通常沙盒的所有进程类型禁用沙箱。 2.--headless ,模式下运行,即没有UI或显示服务器依赖性。 3....--print-to-pdf,保存已加载页面的pdf文件。 6.--window-size,设置初始窗口大小。提供格式“800,600”的字符串。 7....--timeout,指定的毫秒数后发出停止。这将取消所有导航并导致DOMContentLoaded事件触发。 8. --incognito,使用痕模式打开页面。...Chrome浏览器启动参数大全(命令行参数):https://www.cnblogs.com/gurenyumao/p/14721035.html 去除打印pdf网页的页眉页脚,需要在网页的css中加入以下代码

2.7K20

如何在前端下载后端返回的文件,获取请求头中的文件名称

前言在前后端分离的开发模式下,前端需要从后端获取文件流,以便进行文件下载。同时,前端还需要获取请求头中的文件名称,以便用户提供更加友好的下载体验。...获取请求头中的文件名称后端返回文件,通常会在响应头中设置 Content-Disposition 实体字段,用于指定文件名称、类型等信息。...其中,Content-Disposition 实体字段中的 filename 子参数用于指定文件名称。...在前端下载文件,可以通过获取响应头中的 Content-Disposition 实体字段,进而获取文件名称。...利用正则表达式匹配出 filename 子参数的值,即可获取文件名称。最后,创建 标签,将 download 属性设置文件名称。4.

5.6K01

Web应用程序如何创建 PDF

一些场景下,用户都要求一些需要的数据能以 pdf 的格式下载下来。如电子商务商店,经常需要一些报表数据来分析当月的销售情况。 本文中,将探讨如何从一个web应用程序中直接生成一个PDF。...我之前的的推文,最受欢迎的选项是wkhtmltopdf,以及使用Chrome和Puppeteer打印。...WKHTMLTOPDF wkhtmltopdf 接受HTML文件或多个文件,以及样式表,并将其转换为PDF。它通过使用WebKit渲染引擎来实现这一点。... Chrome 另一种是使用的谷歌浏览器来打印 PDF。 然而,再次受到浏览器对 Paged Media 和 fragmentation 支持的限制。...但是,许多情况下,免费工具也很适合。 如果你的的需求非常简单,那么wkhtmltopdf,或者基本的Chrome 和 Puppeteer就可以解决问题。

2.8K30

大前端神器安利之 Puppeteer

协议上的头版 Chrome 。...也可以配置使用完整(非)的 ChromeChrome 素来浏览器界稳执牛耳,因此,Chrome Headless 必将成为 web 应用自动化测试的行业标杆。...已设置 git 提交忽视私密配置文件;如要运行如下几个 Demo,需要手动 src/config 目录下,创建 secret.js,格式如 secretSample.js 所示(?️)。...PDF 此番折腾,是基于 Puppeteer 抓取指定网站页面(示例是 https://jeffjade.com/ 所有文章),并将其打印成 PDF;其目的在于:进一步熟悉运用 Puppeteer。...用 Puppeteer Trace 做性能分析 可以使用 tracing.start 和 tracing.stop 创建一个可以 Chrome 开发工具或时间线查看器中打开的跟踪文件(每个浏览器一次只能激活一个跟踪

2.4K60

实践指南-网页生成PDF

二、技术选型 该功能不需要在前端展示给用户,节省客户端资源,选择服务端实现网页生成 PDF 的功能。 1....会下载与 API 一起使用的最新版本的 Chromium 浏览器,有以下方法可以修改默认设置,不下载浏览器: 环境变量[2]中设置 PUPPETEER_SKIP_CHROMIUM_DOWNLOAD;...指定路径,生成pdf— 上述指定的页面加载完成后,将该页面生成 PDF。...format 表示 PDF 的纸张格式,a4 尺寸 8.27 英寸 x 11.7 英寸,是传统的打印尺寸。 注意:目前仅支持headless: true 模式下生成 PDF 6....CSS 打印样式— 根据官网[3]说明,page.pdf() 生成 PDF 文件的样式是通过 print css media 指定的,因此可以通过 css 来修改生成的 PDF 的样式,以本文需求例,

2.4K41

Selenium和Appium Python自动化测试生成HTML测试报告

,无需其他配置(您也可以将其下载PDF文件)。...TestProject自动您创建HTML和PDF报告(开箱即用,无需其他配置)。...使用TestProject,您可以免费访问可完全自定义的广泛报告功能(如下文所述),包括:云中的详细分析仪表板,屏幕截图,通过/失败条件,自定义错误消息,下载报告的能力转换为PDF,可以轻松地与队友共享报告...() driver.get("https://example.testproject.io/web/") 这两个选项都将导致指定的项目和作业名称显示TestProject中: 指定自定义测试名称...driver = webdriver.Chrome() driver.get("https://example.testproject.io/web/") 当这样指定时,将使用自定义测试名称

1.6K20

【译】如何把你的网页应用转化成PDF

许多网页应用有着能让用户转化下载PDF 格式的文件的需求。某些情况下(例如电子商店),需要快速的根据动态的数据生成 PDF。 在这篇文章中,我会带着大家寻找各种各样可以直接把网页应用。...我我的 tweet 中最为常用的选择就是 wkhtmltopdf(通过 Chrome 或者 Puppeteer)。... CHROME 另一种有趣的方式去生成 PDF 文件就是使用 Chrom 和 Puppeteer。 但是我又再次发现你会被浏览器所支持的 Paged Media 和分块能力所限制。...在你把页面发送到你使用的工具,留意下是否会生成你想要的打印格式。如果是一个普通的打印格式,你页面上用到的CSS 并不一定会在 PDF 文件上正常展示出来。...这些工具创建一个样式就和我们创建一个正常的打印样式一样,做出指定模块是否展示或隐藏的选择,可能还会用到不同的字体大小和颜色。

1.5K60

使用Selenium实现HTMLPDF

前段时间,州的先生为了觅道文档中实现 markdown pdf 的功能,考察和调研的市面上的一些通行解决方案,详见>>>Python转换HTMLPDF方案合集,你中意哪种?。...然后基于对 PyQt5 的熟悉, Windows 上使用 PyQt5 的 QWebengine 小部件对 HTML 文件进行 PDF 转换,测试效果还行。...最后转向了使用 Selenium 调用 Chromium 浏览器的模式,将打开的 HTML 打印导出 PDF,算是比较完美地解决了觅道文档中文集导出 PDF 的问题。...,options=webdriver_options) 然后请求 HTML 文件,path HTML 文件路径,也可以为 url: driver.get(path) 加载及处理 首先等待请求加载的完成...模块调用 实际上,Pypi 中已经存在第三方模块实现了上述的流程,并且添加了 PDF 文件压缩的功能。

3.8K11

快速保存某个网页或者文档,几种方法教你做到,FireShot 捕捉网页截图插件!

第三方网站和登录所需! 最好的免费谷歌Chrome扩展!...你可以用FireShot的网页截图做了什么: ✓捕捉网页完全 页面✓捕捉唯一可见的部分 ✓捕获的选择 ✓截图保存到磁盘PDF,PNG和JPEG ✓截图复制到剪贴板 ✓打印截图 此外,Windows用户可以执行以下操作...: ✓编辑截图:裁剪,调整大小,添加文字和箭头标注,模糊领域和应用效果等 ✓打印 ✓截图保存为PDF文件 ✓截图保存到磁盘PDF,PNG,GIF,JPEG,BMP ✓发送到OneNote(专业版) ✓...其方便的浮动工具条和便捷的快捷键堪称完美结合,截图后的保存选项也特别丰富和方便,同时支持图片转换为PDF文件,以满足各种需要。...丰富的快捷键操作; 丰富的图像存储格式:BMP、GIF、JPEG、PCX、PNG、TGA、TIFF 以及 PDF 文档等; 转换图像多页面 PDF 文档; 从扫描仪获取图像文件; 内存空间占用极小;

3.2K10

wkhtmltopdf入门

安装wkhtmltopdfWindowsWindows系统上,可以从​​wkhtmltopdf​​的官方网站(​​https://wkhtmltopdf.org/)下载可执行文件,并按照安装向导进行安装...实际应用场景一种常见的应用场景是,将网页内容转换为PDF格式后,发送给用户作为报告或文档。假设我们有一个在线学习平台,用户可以平台上学习各种课程,并且可以将学习进度和成绩导出PDF格式的报告。...generating PDF'); } // 将PDF文件发送给用户进行下载 res.download(pdfPath, 'report.pdf', (downloadError)...,当用户访问该路由,会将学习报告页面转换为PDF格式,并将生成的PDF文件提供给用户下载。...wkhtmltopdf 的缺点依赖外部工具: wkhtmltopdf 依赖于 Qt 和 WebKit 来渲染网页并生成 PDF,因此需要安装并配置这些依赖。这样部署和维护可能会增加一些复杂性。

72420

捕获网站截图,留存精彩时刻

这篇文章介绍了几个非常实用的开源项目,它们可以帮助用户将网页转换为图像或 PDF 文件,并提供了丰富而灵活的配置选项来满足不同需求。...它使用 Puppeteer 控制头版 Google Chrome 在后台进行转换。 以下是该项目的核心优势和关键特性: 可以将网页转换为图像或 PDF。...方便易用:以简洁直观的命令行接口用户提供了友好而灵活操作体验。 多平台支持:除了常见系统如 Linux 和 macOS 外, Windows 平台上也有良好兼容性。...该项目的核心优势包括: 支持将复杂的 HTML 和 元素转换为高质量的 SVG 或 PDF 图像。 可以生成多种格式的图片文件,如 PNG、JPEG 等。...本地环境下构建需要安装一些必要工具和依赖库, Linux 上还可以通过 Docker 构建二进制文件

40430

PDF编辑器 PDF Adobe Acrobat Pro DC2021中文版软件安装包下载以及安装教程

不过不仅如此,利用该软件还能帮助用户将任意格式的文件一键装换为PDF文件,或是PDFJPG、Word、PPT、Excel等,总而言之,软件功能非常的全面强大,可以轻轻松松的帮助各大用户们的使用需求。...PDF编辑器全版本下载地址:www.yijiaup.com/baidu-tiaozhuan/zefen/0004.html?...Chrome的编辑、签名、SharePoint 集成等多个功能,致力用户们带来更好的使用体验感。...功能介绍:1.将Microsoft Office文档转换为PDF2.JPG至PDF3.将网页转换为PDF4.从几乎任何文件创建PDF5.压缩PDF以减小尺寸6.将文件合并为一个PDF7.将PDF换为Word...、Excel、PPT8.将PDF换为JPG图片9.将现有表格转换为可填写表格10.比较两个PDF文件安装步骤:1.把资源从百度网盘下载到电脑上面,并解压出来。

1.1K00

word文档转换为图片格式

本教程用于Windows用户将word转换为pdf文档,并可将pdf文档转换为图片(png/jpg等格式)。 ---- 一、wordpdf 1、打开待转换的word文档 ?...2、依次选择 文件-另存为 ? 3、选择保存的目录后,点击文档类型 ? 4、选择pdf文档类型并保存文件 ? 至此,wordpdf文档已完成转换。...二、pdfjpg pdfjpg/png图片在此提供两种转换方式: 在线转换:适用于普通个人隐私信息的文档,网页即可转换,较便捷;pdf转换在线图片 本地转换:适用于带有个人隐私信息的文档,需下载软件...3、转换完成后下载压缩包 ? 4、打开zip压缩包 ? 5、打开图片 (如一个文档页数过多,则会生成多张图片,如本教程) ?...(二)、本地转换 1、下载迅捷pdf转换器 迅捷pdf转换器官网: 2、下载并安装该软件 ? 3、打开软件后选择 文件图片 并添加文件 ? 4、转换文档图片 ?

2.6K10
领券