我是如何用Python获取整个学校女生电话和QQ?技术撩妹

前言:

这个没什么技术难度,懂爬虫的人和程序员都可以用学的语言写出来

只是很多安全问题的存在,的确影响着我们的生活,

希望大家可以认识到一些网站的后台密码的规则与自己的安全性

简单的说,就是是程序员的懒,让用户的信息暴露在互联网上

还有一点:

就是希望正在接触python,和快要放弃学习的同学,可以试试换种思路,

来试试爬虫,这样有成就感的累积,可以慢慢提升你的自信

爬虫开始前的准备:

python2.7

库文件(xlwt,urllib2,BeautifulSoup4,xlrd)

安装库文件的方法:

最好在你的python2.7/script/下面打开power shell(可以shift+右击) 执行下面的:

安装库文件:

pip install *** ***是指上面的库文件,下面不一定都用,只要上面的,以后出什么错,你就继续pip install

观察网站结构(密码规则):

首先这个规则是针对大二和已经毕业了的

密码规则没有添加验证码(其实添加验证码也没什么用,只是添加了爬取门槛)

规则是 用户名==密码

符合条件

这里的用户信息

不要在意这些细节(马赛克) 朦胧美一直是我的追求

具体思路:模拟登陆 ==》制作学号规则==》信息查询(爬取)==》存入xls模拟登陆:因为我们是用爬虫取信息,每次访问,

肯定是登陆了以后才可以访问我们的信息 ==》模拟登陆

当我们用脚本访问下一个页面,需要一个cookie信息,就好比,当你打开

qq空间,其实是想腾讯那里提交了自己的信息,而我们的信息就存在cookie中

python 中cookie维持会话访问:

模拟登陆

具体网址不分享,避免带来不必要的麻烦

学号的列表

用户信息的获取

这里用的的是beautifulsoup库

写入xls(这个是思路)测试用的函数

因为在写的时候因为编码问题,不能写入中文

开始行动:

添加上延迟访问: time.sleep(1)

因为爬虫访问的不和人一样,访问会很快,

这样可以避免被封ip 还有避免给站点带来不好的影响

程序执行结束:

部分截图:有图有真相,避免无知的喷子

学号规则很好找的,这样就获取半个学校的call和qq啦,至于能干嘛,自己脑补。。。

作者:IFTC

源自:https://www.jianshu.com/p/bdcd11afcc2b

声明:文章著作权归作者所有,如有侵权,请联系小编删除

本文来自企鹅号 - python媒体

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏Golang语言社区

Go 语言构建高并发分布式系统实践

你知道互联网最抢手的技术人才有哪些吗?最新互联网职场生态报告显示,最抢手的十大互联网技术人才排名中Go语言开发人员位居第三,从中不难见得,Go语言的渗透率越来越...

45640
来自专栏Python研发

linux入门总结

linux的核心概念知识:      linux软件是开源免费的,而linux是由Unix演变而成,Unix是由MINIX演变而成。 2000年以后,linu...

18420
来自专栏Golang语言社区

Go 语言构建高并发分布式系统实践

你知道互联网最抢手的技术人才有哪些吗?最新互联网职场生态报告显示,最抢手的十大互联网技术人才排名中Go语言开发人员位居第三,从中不难见得,Go语言的渗透率越来越...

55690
来自专栏Python

操作系统简介

一 为什么要有操作系统 现代计算机系统是一个复杂的系统,程序员无法把所有的硬件操作细节都了解到,管理这些硬件并且加以优化使用是非常繁琐的工作,为了将程序员就从这...

23370
来自专栏Ceph对象存储方案

对象存储服务-构架设计

对象存储服务构架设计 基本构架组成 ? 1.网关服务(Gateway): 客户端发送请求(Request)到网关服务(Gateway)再由网关服务实现将客户端请...

61840
来自专栏小白课代表

小白课代表的使用说明(必读)

23920
来自专栏用户2442861的专栏

关于图片或者文件在数据库的存储方式归纳

http://www.cnblogs.com/wangtao_20/p/3440570.html

80710
来自专栏JAVA技术zhai

优化不易,且写且珍惜!

本文要感谢我职级评定过程中的一位评委,他建议把之前所做的各种性能优化的案例和方案加以提炼、总结,以文档的形式沉淀下来,并在内部进行分享。力求达到如下效果:

45470
来自专栏Golang语言社区

为什么决定要重新造一个轮子?

目前网上优秀的开源游戏服务器框架也不少(当然与web框架比起来就少太多了),但总结起来都各有各的优缺点,下面列出我在选型过程中的一些考量,希望大家能开放的讨论,...

77870
来自专栏芋道源码1024

Dubbo源码解析 —— 服务暴露原理

前言 之前讲完了dubbo集群容错系列,现在开始讲比较重要的环节,也就是dubbo面试中比较喜欢问的两个点: 服务发布和 服务引用. 插播面试题 服务发布过程...

40050

扫码关注云+社区

领取腾讯云代金券