前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Python+django网页设计入门(9):自定义反爬虫功能

Python+django网页设计入门(9):自定义反爬虫功能

作者头像
Python小屋屋主
发布2018-12-11 10:23:31
9150
发布2018-12-11 10:23:31
举报
文章被收录于专栏:Python小屋

技术要点:

1)识别请求来自浏览器还是来自爬虫程序,根据不同的访问方式给出不同的响应。

2)获取客户端IP地址并限制其访问时间间隔,如果来自爬虫程序,则多次访问之间的间隔会很短,判断这种情况并给出相应的响应。

3)使用自定义修饰器实现代码复用。

===================

1、修改questions应用的views.py文件,导入time标准库中的time()函数,并定义修饰器函数isCraw()。

2、把定义的修饰器作用到相应的视图函数上,以登录界面为例。

3、执行命令,运行网站,使用浏览器打开登录界面,一切正常。

4、使用Python模块urllib编写简单爬虫程序,尝试读取登录界面信息,失败。

5、修改程序,伪装浏览器访问登录页面,成功。

6、进一步修改爬虫程序,连续多次读取登录页面,第一次成功,后面失败。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-11-02,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Python小屋 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档