前言
这几天在公众号Python交流群里有人问道XX文库怎么免费下载,心想着我也没研究过这个,不知道难不难,于是自己去抓了一下包。其实难度不是很大,只是包的数据比较多不太好找,这里我只提供思路,不会提供代码,大家懂就行,当然如果你还是写不出,可以私聊我进Python交流群。
首先我们来分析一下PPT的下载,其实对于这种数据一般都是采用抓包的思路来进行的。
我一个一个找了一下,发现上面的数据包中有我们想要的数据,我们看下拿到了什么数据:
我们看到了有一个参数为20。恰好,我们想要下载的PPT也是20页,于是访问一下zoom中的链接。
正是我们要的,所以后面你懂得,就交给帅气牛逼的你了!
随意找了个word文档,同样的思路,我们还是来抓包,当然这个包跟我们之前的肯定不同。
同样查看这个包,看看这个包给了我们什么数据:
可以看到这就是word当中的文字信息,当然有些小伙伴说为啥你这不只是拿到文字信息么?确实这样只能拿到文字信息,但是在这串数据里面有相应的位置坐标信息。帅气牛逼的你们可以自己取折腾折腾!
关于txt就有点小麻烦了,首先我们需要获取该txt文档的id名称
我们可以直接从链接当中获取。
然后我们直接进行url的搜索
搜索关键词,975114ef19e8b8f67c1cb9d9是我的文件id,自己修改
wkretype.bdimg.com/retype/text/975114ef19e8b8f67c1cb9d9
我们双击筛选出来的包:
你可能一脸懵逼,但是我们去转换一下字符编码:
可以看到正是我们需要的数据。后面的大家就自己解决啦!