前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >群友:谁帮我下个xx文库的文件 大佬:过来,我给你爬一下

群友:谁帮我下个xx文库的文件 大佬:过来,我给你爬一下

作者头像
Python进击者
发布2020-05-08 15:50:12
4460
发布2020-05-08 15:50:12
举报
文章被收录于专栏:JAVAandPython君

前言

这几天在公众号Python交流群里有人问道XX文库怎么免费下载,心想着我也没研究过这个,不知道难不难,于是自己去抓了一下包。其实难度不是很大,只是包的数据比较多不太好找,这里我只提供思路,不会提供代码,大家懂就行,当然如果你还是写不出,可以私聊我进Python交流群。

XX文库分析

PPT

首先我们来分析一下PPT的下载,其实对于这种数据一般都是采用抓包的思路来进行的。

我一个一个找了一下,发现上面的数据包中有我们想要的数据,我们看下拿到了什么数据:

我们看到了有一个参数为20。恰好,我们想要下载的PPT也是20页,于是访问一下zoom中的链接。

正是我们要的,所以后面你懂得,就交给帅气牛逼的你了!

word

随意找了个word文档,同样的思路,我们还是来抓包,当然这个包跟我们之前的肯定不同。

同样查看这个包,看看这个包给了我们什么数据:

可以看到这就是word当中的文字信息,当然有些小伙伴说为啥你这不只是拿到文字信息么?确实这样只能拿到文字信息,但是在这串数据里面有相应的位置坐标信息。帅气牛逼的你们可以自己取折腾折腾!

txt

关于txt就有点小麻烦了,首先我们需要获取该txt文档的id名称

我们可以直接从链接当中获取。

然后我们直接进行url的搜索

搜索关键词,975114ef19e8b8f67c1cb9d9是我的文件id,自己修改

代码语言:javascript
复制
wkretype.bdimg.com/retype/text/975114ef19e8b8f67c1cb9d9

我们双击筛选出来的包:

你可能一脸懵逼,但是我们去转换一下字符编码:

可以看到正是我们需要的数据。后面的大家就自己解决啦!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-04-20,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Python进击者 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • XX文库分析
    • PPT
      • word
        • txt
        领券
        问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档