深入理解HTTP

0x01 HTTP是什么

HTTP全称是HyperText Transfer Protocal,即:超文本传输协议。它主要规定了客户端和服务器之间的通信格式。HTTP还是一个基于请求/响应模式的、无状态的协议;即我们通常所说的Request/Response。

0x02 HTTP与TCP的关系

TCP协议是位于TCP/IP参考模型中的网络互连层,而HTTP协议属于应用层。因此,HTTP协议是基于TCP协议。

0x03 HTTP请求(HTTP Request)

HTTP请求由三部分组成,分别是:

  • 请求行
  • HTTP头
  • 请求体

下面是请求示例:

GET /?tn=90058352_hao_pg HTTP/1.1
Host: www.hao123.com
Connection: keep-alive
Cache-Control: max-age=0
Accept:text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8
Upgrade-Insecure-Requests: 1
User-Agent: Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.102 UBrowser/5.7.16400.16 Safari/537.36
Accept-Encoding: gzip, deflate
Accept-Language: zh-CN,zh;q=0.8
请求行

同样也是由请求方法(POST/GET)方式、请求的主机、协议版本号三部分组成。下面为请求行的示例: GET /?tn=90058352_hao_pg HTTP/1.1

HTTP头

HTTP头又细分为请求头(request header)、普通头(general header)、实体头(entity header) 而HTTP头主要关注点是其字段

1. Accept

作用: 浏览器可以接受的媒体类型 例如: Accept: text/html 代表浏览器可以接受服务器回发的类型为 text/html 也就是我们常说的html文档 通配符 * 代表任意类型 例如: Accept: */* 代表浏览器可以处理所有类型,(一般浏览器发给服务器都是发这个)

2. Accept-Language

作用: 浏览器申明自己接收的语言。 语言跟字符集的区别:中文是语言,中文有多种字符集,比如big5,gb2312,gbk等等; 例如: Accept-Language: zh-CN,zh

3. Accept-Encoding

作用: 浏览器申明自己接收的编码方法,通常指定压缩方法(gzip,deflate) 例如:Accept-Encoding: gzip, Accept-Encoding: deflate

4. User-Agent

作用: 告诉HTTP服务器, 客户端使用的操作系统的名称和版本以及浏览器的名称和版本. 例如: User-Agent: Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.102 UBrowser/5.7.16400.16 Safari/537.36

5. Content-Type

作用: 告诉服务器,请求的内容的类型 常见的字段: 假设使用POST方式请求

  • text/xml [请求体为文本]
  • application/json [请求体为JSON数据]
  • application/xml [请求体为xml数据]
  • image/jpeg [请求体为jpeg图片]
  • multipart/form-data [请求体为表单]

作用: 最重要的header,将cookie的值发送给HTTP服务器

7. Connection

例如: Connection: keep-alive 当一个网页打开完成后,客户端和服务器之间用于传输HTTP数据的TCP连接不会关闭,如果客户端再次访问这个服务器上的网页,会继续使用这一条已经建立的连接 例如: Connection: close 代表一个Request完成后,客户端和服务器之间用于传输HTTP数据的TCP连接会关闭, 当客户端再次发送Request,需要重新建立TCP连接。

8. Content-Length

作用:发送给HTTP服务器数据的长度。 例如: Content-Length: 18

9. Referer:

作用: 提供了Request的上下文信息的服务器,告诉服务器我是从哪个链接过来的。

请求体

这个只有post方式请求才有,get方式请求没有。

0x04 HTTP响应(HTTP Response)

HTTP Response的结构跟Request的结构基本一样。同样分为三部分:

  • 响应行
  • 响应头
  • 响应体

下面是响应示例:

HTTP/1.1 200 OK
Cache-Control: max-age=0
Content-Encoding: gzip
Content-Length: 156474
Content-Type: text/html;charset=UTF-8
Cxy_all: 90058352_hao_pg+d4fa7f28cefb9b120f868558e440bafa
Date: Sun, 20 Nov 2016 05:09:51 GMT
Expires: Sun, 20 Nov 2016 05:09:51 GMT
Lfy: nj02.11
Server: BWS/1.0
Set-Cookie: __bsi=11619936655404239050_00_60_N_R_126_0303_c02f_Y; max-age=3600; domain=www.hao123.com; path=/
响应行

响应行由协议版本、响应状态构成 下面为响应行的示例: HTTP/1.1 200 OK

响应头

响应头关注点是字段,常见的字段如下:

1.Cache-Control

作用: 非常重要的规则。 这个用来指定Response-Request遵循的缓存机制。 例如: Cache-Control:Public 可以被任何缓存所缓存 Cache-Control:Private 内容只缓存到私有缓存中 Cache-Control:no-cache 所有内容都不会被缓存

2.Content-Type

作用:服务器告诉浏览器,自己响应的对象的类型和字符集 例如: Content-Type: text/html; charset=utf-8 Content-Type: image/jpeg

3.Expires

作用: 浏览器会在指定过期时间内使用本地缓存 例如: Expires:Sun, 20 Nov 2016 05:09:51 GMT

4.Connection

跟HTTP头中的Connection是同样的原理

5.Content-Encoding

跟HTTP中头的Content-Encoding是同样的原理

6.Content-Length

作用:指明实体正文的长度,以字节方式存储的十进制数字来表示。 例如: Content-Length: 156474

7.Date

作用: 生成消息的具体时间和日期 例如: Date: Sun, 20 Nov 2016 05:09:51 GMT

响应体

响应体包含的内容是网页的内容信息,主要是html代码等

作者:猴哥,公众号:极客猴。爱好读书,喜欢钻研技术,梦想成为文艺青年的IT Boy。

- END -

原文发布于微信公众号 - 极客猴(Geek_monkey)

原文发表时间:2016-11-20

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏数据和云

1024 程序员节:给 DBA 们的福音

通过 rpm 安装包,支持 yum 安装,这基本上将单实例的企业版数据库安装简化为一条命令:

19020
来自专栏Python

linux目录结构详细介绍

32430
来自专栏Java帮帮-微信公众号-技术文章全总结

Shiro权限管理详解

1 权限管理 1.1 什么是权限管理 基本上涉及到用户参与的系统都要进行权限管理,权限管理属于系统安全的范畴,权限管理实现对用户访问系统的控制,按照安全规则或者...

1.6K50
来自专栏编程

移动Web性能测试笔记之二

收集整理 @2017/12/21 Chrome浏览器Network面板http请求时间分析 Chrome浏览器开发者工具Network窗口下,可以查看下载各组件...

18790
来自专栏沃趣科技

ASM磁盘容量改变的故障处理

某个数据库环境中的ASM磁盘,由于历史原因,全部配置为没有RAID信息的JBOD模式。今天在做产品升级,由于软件需要,需要将原来加入到ASM中每个JBOD的磁盘...

369140
来自专栏枕边书

PHP模拟发送POST请求之一、HTTP协议头部解析

  WEB开发中信息基本全是在POST与GET请求与响应中进行,GET因其基于URL的直观,易被我们了解,可POST请求因其信息的隐蔽,在安全的同时,也给开发者...

37770
来自专栏喵了个咪的博客空间

phalcon-进阶篇2(拦截器)

#phalcon-进阶篇2(拦截器)# ? 本教程基于phalcon2.0.9版本 ##前言## 先在这里感谢各位phalcon技术爱好者,我们提供这样一个优秀...

33470
来自专栏实用工具入门教程

如何部署 ftp 文件服务

文件传输协议(英文:File Transfer Protocol,缩写:FTP)是用于在网络上进行文件传输的一套标准协议,使用客户/服务器模式。它属于网络传输协...

86330
来自专栏北京马哥教育

Nginx+FPM结构模型剖析及优化

随着php脚本语言使用的普及,目前webserice服务大部分都在用nginx+(php-fpm)的结构,了解了其工作过程后才可以在各个方面想办法做调整优化和故...

47760
来自专栏Java3y

Linux用户和权限管理看了你就会用啦

没想到上一篇能在知乎获得千赞呀,Linux也快期末考试了,也有半个月没有写文章了。这篇主要将Linux下的用户和权限知识点再整理一下。

3.9K10

扫码关注云+社区

领取腾讯云代金券