版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/weixin_43908900/article/details/102537238
–爬虫的定义:
通过编写程序,模拟浏览器行为访问网页,获取互联网上的数据,也称为蜘蛛,如:百度;谷歌,都是爬虫。
注意:
–爬虫的分类:
–概念混淆:
–robots协议:君子协议,里面限制了哪些可爬,哪些不可爬,但是你可以不用遵守。
–爬虫流程的概括:
–URL(统一资源定位符,俗称网址)
–超文本(HTML)
–HTTP/HTTPS协议介绍
–cookies简单介绍介绍
扫码关注腾讯云开发者
领取腾讯云代金券
Copyright © 2013 - 2025 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有
深圳市腾讯计算机系统有限公司 ICP备案/许可证号:粤B2-20090059 深公网安备号 44030502008569
腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号 | 京公网安备号11010802020287
Copyright © 2013 - 2025 Tencent Cloud.
All Rights Reserved. 腾讯云 版权所有