前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >学习爬虫的第一天

学习爬虫的第一天

作者头像
py3study
发布2020-01-17 11:38:50
4390
发布2020-01-17 11:38:50
举报
文章被收录于专栏:python3python3python3

爬虫是什么?

网络就如同蜘蛛网,而数据相当于里面的节点,爬虫如同蜘蛛,通过节点去获取蜘蛛网上的内容,获取想要的数据信息

获取网页数据方式:

1、浏览器访问——下载网页数据

2、模拟浏览器对网页进行访问——解析数据——将所需要的内容保存在本地

其中第二种方式就是爬虫的整体流程

首先先了解下关于网页必备知识

https和http的区别?

http:明文显示,端口号为80

https:进行加密,添加数字证书,端口号为443

网络请求方式

GET

POST

PUT

HEAD

DELETE

PATCH

简单说下GET和POST区别

GET请求:HTPP默认的请求方式是GET;

GET请求的特点:

*没有请求体,携带数据保存在URL后面

*GET请求携带的参数必须在4k之内

*GET请求的携带的数据由于封装在URL后面,所以会暴露在浏览器地址栏中

POST请求的特点

*有请求体,数据保存在请求体中

*上传提交的数据可以无限大

*请求体中如果存在中文,会使用URL编码!

 第一次写博客,过程不太熟悉,望大神们多加指导2019-05-23

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2019-06-07 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档