前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >遇到禁止复制该怎么办?幸好我会Python...

遇到禁止复制该怎么办?幸好我会Python...

作者头像
Python研究者
发布2021-07-20 11:44:21
4520
发布2021-07-20 11:44:21
举报
文章被收录于专栏:Python研究者Python研究者

大家好,我是辰哥!

相信大家都有遇到这种情况(无法复制):

或者是这种情况

以上这种情况都是网页无法复制文本的情况。不过这些对于Python来说都不是问题。今天辰哥就叫你们用Python去解决。

思路:利用pdfkit库将html网页保存为pdf

01

小案例

1、安装pdfkit库

代码语言:javascript
复制
pip install pdfkit

通过命令安装pdfkit,此外还需要安装exe文件(wkhtmltopdf)。

代码语言:javascript
复制
下载链接:https://wkhtmltopdf.org/downloads.html

选择对于的版本下载并安装(记住自己的安装目录

2、小案例

先看一下这个网页(辰哥自己的网页:www.chenlove.cn

目标:将这个网页保存为pdf

代码语言:javascript
复制
import pdfkit
import time

if __name__ == '__main__':
    url = "http://www.chenlove.cn"
    config = pdfkit.configuration(wkhtmltopdf=r'D:\software\wkhtmltopdf\bin\wkhtmltopdf.exe')
    pdfkit.from_url(url, r"D:\公众号\0622\%s.pdf"
                    % time.strftime('%Y-%m-%d-%H-%M-%S', time.localtime(time.time())), configuration=config)

其中的config就是上面安装的wkhtmltopdf的路径。

效果:

可以看到,我们已经成功将这个网页保存为pdf

下面我们开始尝试禁止复制的网页

02

实战

1、目标网站

这里我们现在简书平台的其中一篇文章进行测试(文章设置了禁止复制

比如我要进行复制的时候,同时禁止转载(不让复制),下面开始将这个网页保存pdf。

代码语言:javascript
复制
import pdfkit
import time

if __name__ == '__main__':
    url = "https://www.jianshu.com/p/717dc02a9c21"
    config = pdfkit.configuration(wkhtmltopdf=r'D:\software\wkhtmltopdf\bin\wkhtmltopdf.exe')
    pdfkit.from_url(url, r"D:\公众号\0622\%s.pdf"
                    % time.strftime('%Y-%m-%d-%H-%M-%S', time.localtime(time.time())), configuration=config)

这样将内容保存为pdf就可以直接进行复制了。

感兴趣的小伙伴,可以尝试其他的网页(你懂得

03

小结

本文的讲解就到这里,内容主要是将网页保存为pdf,对于其他禁止复制的网页、长网页等都可以保存为pdf。大家下去可以去自己尝试。

一定要动手尝试!一定要动手尝试!一定要动手尝试!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-06-22,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Python研究者 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1、安装pdfkit库
  • 2、小案例
  • 1、目标网站
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档