首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

如何使用wkhtmltopdf生成具有可选择和可搜索文本的PDF?

要使用wkhtmltopdf生成具有可选择和可搜索文本的PDF,请按照以下步骤操作:

  1. 安装wkhtmltopdf:首先,您需要在您的计算机上安装wkhtmltopdf。您可以从官方网站下载适用于您操作系统的安装包。
  2. 安装Webkit:wkhtmltopdf依赖于Webkit浏览器引擎,因此您需要安装Webkit。对于Windows用户,您可以从以下链接下载安装包:https://webkit.org/building-webkit/ 。对于Mac用户,Webkit已经预装在操作系统中。对于Linux用户,您可以使用包管理器安装Webkit。
  3. 编写代码:使用您喜欢的编程语言编写代码,调用wkhtmltopdf命令行工具,将HTML文件转换为PDF。以下是一个Python示例:
代码语言:python
复制
import subprocess

html_file = 'input.html'
pdf_file = 'output.pdf'

command = f'wkhtmltopdf {html_file} {pdf_file}'
subprocess.run(command, shell=True)
  1. 生成可选择和可搜索文本的PDF:要生成具有可选择和可搜索文本的PDF,您需要在wkhtmltopdf命令中添加一些额外的参数。以下是一个示例:
代码语言:python
复制
import subprocess

html_file = 'input.html'
pdf_file = 'output.pdf'

command = f'wkhtmltopdf --print-media-type --javascript-delay 5000 --no-background {html_file} {pdf_file}'
subprocess.run(command, shell=True)

在这个示例中,我们添加了以下参数:

  • --print-media-type:将CSS媒体类型设置为“print”,以确保正确的页面布局。
  • --javascript-delay:指定在生成PDF之前等待的毫秒数,以确保JavaScript执行完成。
  • --no-background:不要在PDF中包含背景图像。
  1. 测试:运行您的代码,生成PDF文件,并使用PDF阅读器打开它。您应该能够选择并搜索文本。

请注意,生成可选择和可搜索文本的PDF可能会导致生成速度变慢,因为wkhtmltopdf需要渲染整个页面。根据您的需求和网页复杂性,生成时间可能会有所不同。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

pdfkit,生成PDF就靠它了

搜索了下 “python 生成pdf” 之类关键词,很多博客推荐 Python 第三方库pdfkit,可以将网页、html文件以及字符串生成 pdf 文件。...三步实现自动生成pdf文档: 使用pip安装pdfkit库 python 版本 3.x,在命令行输入: pip install pdfkit ?...安装wkhtmltopdf 使用pdfkit库生成pdf文件 前面说过pdfkit可以将网页、html文件、字符串生成pdf文件。...,'out_3.pdf') 结论 本文讲了如何在 Python 中使用pdfkit库生成pdf文件,非常方便快捷,适合批量自动化操作。 我们看看生成 pdf 效果如何: ?...pdf效果展示 整体页面视觉不错呦,赶快用起来吧! 另外我们之前还有一个 pdfkit 相关应用案例参考: 一键下载:将知乎专栏导出成电子书 作者:朱卫军 来源:Python大数据分析

2.7K10

Python中pdfkit入门

这对于需要保存网页内容或分享打印版本内容非常有用。生成报告和文档:通过将文本、图表图像渲染为HTML,然后将其转换为PDF,可以方便地生成丰富格式报告和文档。...你可以使用pdfkit将HTML转换为高质量PDF文件,并使用丰富配置选项来控制生成PDF文件。...这对于需要保存网页内容或分享打印版本内容非常有用。生成报告和文档:通过将文本、图表图像渲染为HTML,然后将其转换为PDF,可以方便地生成丰富格式报告和文档。...这可能会对部署使用造成一些麻烦,特别是在不同操作系统环境下。兼容性问题:由于pdfkit是基于Wkhtmltopdf工具底层实现,所以其兼容性受到Wkhtmltopdf影响。...它提供了丰富功能,包括文本、表格、图像图表创建和布局。尽管它不提供直接将HTML转为PDF功能,但可以使用其强大布局样式功能来手动创建PDF

39630

wkhtmltopdf入门

希望这个示例代码能帮助你理解如何在实际应用场景中使用​​wkhtmltopdf​​来将网页内容转换为PDF格式。...wkhtmltopdf 缺点依赖外部工具: wkhtmltopdf 依赖于 Qt WebKit 来渲染网页并生成 PDF,因此需要安装并配置这些依赖。这样在部署维护时可能会增加一些复杂性。...渲染结果可能不一致: 由于 wkhtmltopdf 使用渲染引擎浏览器可能与用户使用浏览器不同,所以最终生成 PDF 可能与用户预期不一致。...它支持模板自定义样式,并且具有良好 JavaScript 支持。...它具有强大功能,可以进行更复杂自定义操作,但是使用相对复杂。 以上工具都有它们自己特点优势,使用时可以根据具体需求选择合适工具。

57520

Python还能做这个?真的好棒棒耶!

專 欄 ❈爱撒谎男孩,Python中文社区专栏作者 博客:https://chenjiabing666.github.io ❈ 准备 好吧,其实我想说如何用Python制作电子书,使用是python...pdfkit用法 初级了解函数 pdfkit.from_url([url,],'demo.pdf') 这个是直接传入一个url或者一个url列表,然后通过这个函数直接将其网页转换成demo.pdf,注意这里只能转换静态文本...,如果使用js一些脚本的话是不能直接转换 ?...,详情请见http://wkhtmltopdf.org/usage/wkhtmltopdf.txt, 你可以移除选项名字前面的 ‘–’ .如果选项没有值, 使用None, Falseor ,* 作为字典值...注意 这里生成pdf时候可能出现中文乱码,请一定在html模板开头指定字体utf-8-> 可能在爬取生成时候会出现ascii错误,只需要在py文件开头写下

1.3K80

wkhtmltopdf参数详解及精讲使用方法

wkhtmltopdf参数详解及精讲使用方法 术语定义 文档对象 “文档对象”是指PDF文档中文档对象,共有三种类型“文档对象”,他们分别是“页面对象”,“封面对象”“目录对象”。...如果你能接受灰度PDF文档,并不影响实际使用,那就请使用这个参数吧。生成PDF文档越大,使用此参数获得惊喜就越大。...这个参数也值得推荐,你最好先尝试一下,看看使用此参数后生成PDF文档与不使用此参数区别再做决定。...如果开启 --no-backgroupd 参数,则生成PDF文档中不会有HTML页面中背景图片背景色。...你可以在这些JS中对页面的结构内容进处理,JS执行完成后才会把对应页面生成PDF文档。

19810

工作效率:通过pdfkit包实现网页导出为pdf

幸好我会Pytho,相信大家都有遇到这种情况(无法复制): 或者是这种情况 以上这种情况都是网页无法复制文本情况。不过这些对于Python来说都不是问题。今天辰哥就叫你们用Python去解决。...它就是html转成pdf工具包wkhtmltopdfPython封装。所以,必须手动安装wkhtmltopdf。...选择对于版本下载并安装(记住自己安装目录) CentOS系统可以直接使用以下命令安装: $sudo yum intsall wkhtmltopdf 2.使用 2.1将url生成pdf文件 不指定wkhtmltopdf...,会从系统默认执行路径下找 wkhtmltopdf import pdfkit '''将url生成pdf文件''' def url_to_pdf(url, to_file): pdfkit.from_url...pdfkit '''将url生成pdf文件''' def url_to_pdf(url, to_file): config = pdfkit.configuration(wkhtmltopdf

8510

卧槽,一行命令实现Html转PDF,强烈推荐!

大家好,我是爱撸码开源大叔! 大家在日常工作当中,应该经常会遇到将网页保存为PDF文档需求。 一般而言,直接使用浏览器自带“打印”功能,选择“另存为PDF”,即可以输出 PDF 了。...项目功能 使用方法 1、安装 官网地址是: https://wkhtmltopdf.org/ 选择你正在使用操作系统对应安装文件即可。...2、基本使用 软件安装完成之后,就可以使用了。这里以 搜狗首页 为例,展示如何将 搜狗首页保存为 PDF 文件。...以 Python 为例,需要再安装pdfkit库(Python对wkhtmltopdf调用封装库),支持URL,本地文件,文本内容到PDF转换,实际转换还是最终调用wkhtmltopdf命令。...config) 最后,关于这个项目的更多详细使用功能,大家可以自己查阅下开源项目地址官网: Github地址:https://github.com/wkhtmltopdf/wkhtmltopdf

1.6K30

Java后端:html转pdf实战笔记

htmltopdf 是一款基于wkhtmltopdf技术html转pdf文档java类库,支持html转pdfurl转pdf。...Wkhtmltopdf可直接把浏览器中浏览网页转换成一个pdf,他是一个把html页面转换成pdf软件(需要安装在服务器上)。使用时可通过java代码调用cmd指令完成网页转换为pdf功能。...–cookie 设置一个额外cookie(重复) –cookie-jar 读取写入Cookie,并在提供cookie jar文件 –copies 复印打印成pdf文件数(默认为1) –cover...等待几毫秒为JS-重定向(default 200) –replace* 替换名称,值页眉页脚(重复) –stop-slow-scripts 停止运行缓慢JavaScripts –title 生成...url方式生成pdf预览效果如下大家如果使用过程中遇到问题可以互相沟通交流!

1.1K60

一口气整理整个专集网页为一本电子书方法

因我们想要图文版数据,而不是单纯地一些结构化数据,所以最简单方式是类似浏览器行为CTRL+S保存为网页到本地。同样使用代码模拟发送键按键方式实现。有兴趣读者参看以下代码。...网页转PDF工具为wkhtmltopdf,也是命令行工具,可以多语言调用,dotNET调用当然没问题,不过更好体验,当属在PowerShell上使用。...通常可看到pythonhtml转pdf功能,其实底层也是用wkhtmltopdf完成。 多个网页转PDF,需要考虑排序问题,这时候,使用Excel催化剂可以轻松实现HTML排版顺序问题。...文件是使用相对路径,需要先将PowerShell的当前路径切换到html存放文件夹,切换命令就是CD。 最后激动人心时刻到了,可以顺利生成一个pdf文件。...之前一个错误做法是追求PDF阅读器精简,现在重新用回【福昕阅读器】(感谢上篇发文后读者朋友推荐),老牌免费PDF阅读软件,可以对文本PDF文件进行标注,做笔记。在此推荐大家使用

1.8K30

教你两招,轻松搞定html页面导出为pdf文件

由于我们项目前端是采用vue,经过测试以后,我发现wkhtmltopdf好像并不支持Vue语法。也可能是我使用方式不当。欢迎小伙伴指正。...而且itext7更多用于需要去维护PDF模板场景,并不适合我本次需求。所以我最终使用html2canvas+jsPDF方式来实现。...如果我们想要把PDF保存一份到服务器,需要自己手动实现将文件上传到服务器。 wkhtmltopdf 接下来我们来看看wkhtmltopdf这种方式如何实现?...如果我们要使用wkhtmltopdf,需要安装官方提供软件,大家可以在他官网进行下载。 https://wkhtmltopdf.org/downloads.html ?..."; private static final String LINUX_URL = "/opt/wkhtmltox/bin/wkhtmltopdf"; 下面我们看一看如何使用,我们需要将我们导出页面的路径拼接后作为参数传递进来

3.1K30

python制作电子书

文章目录 1. python制作pdf电子书 1.1. 准备 1.1.1. 安装wkhtmltopdf 1.1.2. python安装依赖包 1.2. pdfkit用法 1.2.1....参考文章 python制作pdf电子书 准备 制作电子书使用是pythonpdfkit这个库,pdfkit是 wkhtmltopdf Python封装包,因此在安装这个之前要安装wkhtmltopdf...pdfkit.from_url([url,],'demo.pdf') 这个是直接传入一个url或者一个url列表,然后通过这个函数直接将其网页转换成demo.pdf,注意这里只能转换静态文本,如果使用...' pdfkit.from_file('demo.html','demo.pdf',options=options,cover=cover,css=css) 注意 这里生成pdf时候可能出现中文乱码...BeautifulSouprequests,详情可以看我博客中BeautifulSoup用法,后续还会更新requests用法 源代码请见https://github.com/chenjiabing666

1.5K40

PDF技术 -Java实现Html转PDF文件

评价 综合:使用WKHtmlToPdf效果(样式)最好。但速度较慢(对于文件来说)。其余均有大大小小失真问题。...1. wkhtmltopdf(速度慢、需要安装软件) wkhtmltopdf是一个用webkit网页渲染引擎开发用来将html转成 pdf工具,跟多种脚本语言进行集成来转换文档,有windows、...原理: 使用wkhtmltopdf工具对url或html进行转换 使用命令: Wkhtmltopdf  https:baidu.com  /usr/local/temp/baidu.pdf 安装 下载地址...PD4ML(样式有问题) PD4ML是纯Java类库,使用HTML、CSS作为页面布局内容定义格式来生成PDF文档强大工具,可以简化最终用户生成PDF工作。...各种方案都有缺点,但是在线转换方案转化效率以及对CSS等支持程度比较好。也不知道他们这些内部是如何实现

12.2K30

Go每日一库之149:PDF处理相关库

我了解到支持pdf加水印具有: unidoc/unipdf pdfcpu 1.unidoc/unipdf unidoc平台开发unipdf是一款用Go语言编写PDF库,提供APICLI使用模式...pdfcpu pdfcpu 是一个用Go语言编写PDF处理库,提供APICLI模式使用 支持以下功能: $ pdfcpu help ......这里使用xpdf将pdf文字解析出来,然后再使用一些字符串操作或者正则表达式进行业务分析 使用xpdf/pdftotext解析pdf文本 $ pdftotext input.pdf output.txt...使用unipdf解析pdf文本 $ unipdf extract text input.pdf 使用API解析pdf文本,参考unipdf github examples 使用坐标信息解析pdf...有些功能在大多数库中都是有重复,具体使用中会遇到什么问题,还是要看实际情况如何

1.1K40

用python实现csdn博主全部博文下载,html转pdf,有了学习电子书了。。。(附源码)

(附源码) 我们学习编程,在学习时候,会有想把有用知识点保存下来,我们可以把知识点内容爬下来转变成pdf格式,方便我们拿手机可以闲时翻看,是很方便 先来一个单个博文下载转pdf格式操作 ?...python中将html转化为pdf常用工具是Wkhtmltopdf工具包,在python环境下,pdfkit是这个工具包封装类。如何使用pdfkit以及如何配置呢?分如下几个步骤。...css选择器获取标签文本主体为代码要点部分 css语法部分 html_css = parsel.Selector(响应数据) html_content = html_css.css('要获取部分...# css选择器获取标签文本主体 html_css = parsel.Selector(response_2) html_content = html_css.css(...文件, 第二个参数转变后pdf文件, configuration=pdfkit.configuration(wkhtmltopdf=r'这里为下载

57920

Web应用程序如何创建 PDF

在一些场景下,用户都要求一些需要数据能以 pdf 格式下载下来。如电子商务商店,经常需要一些报表数据来分析当月销售情况。 在本文中,将探讨如何从一个web应用程序中直接生成一个PDF。...从HTMLCSS开始 首先考虑如何使用HTMLCSS生成PDF版本。 CSS确实有一个处理打印CSS规范,就是 Paged Media module。...用户生成PDF最简单方法是直接通过浏览器,选择打印 PDF,将生成一个PDF。可悲是,这个PDF通常并不完全令人满意!首先,它会有页眉页脚,当你从网页打印内容时,这些页眉页脚会自动添加。...在我之前推文时,最受欢迎选项是wkhtmltopdf,以及使用无头ChromePuppeteer打印。...使用打印用户代理 如果你想继续使用 HTML CSS 解决方案,那么你需要查看用于从 HTML CSS 打印用户代理(UA),其中包含用于从文件生成 PDF API。

2.7K30

html页面导出为pdf(jsPDF、iText、wkhtmltopdf

(暂时还没解决) 支持 支持 支持 支持 支持 支持 wkhtmltopdf 1、调用方式简单(只需执行一行脚本);2、生成pdf质量较高 1、服务器需要安装wkhtmltopdf环境;2、根据网址生成...= new jsPDF('', 'pt', 'a4'); //有两个高度需要区分,一个是html页面的实际高度,生成pdf页面高度(841.89)...---- wkhtmltopdf是一个可以把html转为pdf插件,有windows、linux等平台版本,最大特点就是使用简单,语言无关性。...wkhtmltopdf两个文件,生成pdf可以直接运行wkhtmltopdf(也可以把bin目录配置到环境变量),执行wkhtmltopdf -V查看是否可以执行。...参数详解 4、解决wkhtmltopdf支持中文缩放问题:wkhtmltopdf折腾记 与之类似的还有一个叫Phantomjs插件,效果差不多,还没深入研究。

6.4K10
领券