2.1 HTTP
[TOC]
1.简介
端口号80,应用层协议
方法
- GET : 获取资源
- POST : 传输实体主体
- PUT : 传输文件
- HEAD : 获得报文首部
- DELETE : 删除文件
- OPTIONS : 询问支持的方法
- TRACE : 追踪路径
- CONNECT : 要求使用隧道协议链接代理(使用SSL Secure Sockets Layer 安全套接层、或 TLS Transport Layer Security 传输层安全)
持久连接节省通信量 HTTP keep-alive或connection reuse,只要任意一方没有明确提出断开连接,则保持TCP状态
2.瓶颈和缺点
缺点
- 明文传输 (容易窃听)
- 缺乏服务认证手段 (容易被中间人攻击)
- 缺乏完整性校验 (容易被篡改)
瓶颈
- 不保存状态
- 一条连接上只能发送一个请求
- 请求只能从客户端开发,客户端不能接收除响应外的指令
- 请求、响应首部未经压缩就发送。首部信息越多延迟越长
- 发送冗长的首部。每次互相发送相同的首部造成的浪费较多
- 可任意选择数据压缩格式。非强制压缩发送
3.版本区别
影响一个 HTTP 网络请求的因素主要有两个:带宽和延迟。
带宽:如果说我们还停留在拨号上网的阶段,带宽可能会成为一个比较严重影响请求的问题,但是现在网络基础建设已经使得带宽得到极大的提升,我们不再会担心由带宽而影响网速,那么就只剩下延迟了。
延迟:
浏览器阻塞(HOL blocking):浏览器会因为一些原因阻塞请求。浏览器对于同一个域名,同时只能有 4 个连接(这个根据浏览器内核不同可能会有所差异),超过浏览器最大连接数限制,后续请求就会被阻塞。
DNS 查询(DNS Lookup):浏览器需要知道目标服务器的 IP 才能建立连接。将域名解析为 IP 的这个系统就是 DNS。这个通常可以利用DNS缓存结果来达到减少这个时间的目的。
建立连接(Initial connection):HTTP 是基于 TCP 协议的,浏览器最快也要在第三次握手时才能捎带 HTTP 请求报文,达到真正的建立连接,但是这些连接无法复用会导致每次请求都经历三次握手和慢启动。三次握手在高延迟的场景下影响较明显,慢启动则对文件类大请求影响较大。
1.1 和 1.0和的区别
-
缓存处理
在HTTP1.0中主要使用header里的If-Modified-Since,Expires来做为缓存判断的标准,HTTP1.1则引入了更多的缓存控制策略例如Entity tag,If-Unmodified-Since, If-Match, If-None-Match等更多可供选择的缓存头来控制缓存策略。 -
带宽优化及网络连接的使用
HTTP1.0中,存在一些浪费带宽的现象,例如客户端只是需要某个对象的一部分,而服务器却将整个对象送过来了,并且不支持断点续传功能,HTTP1.1则在请求头引入了range头域,它允许只请求资源的某个部分,即返回码是206(Partial Content),这样就方便了开发者自由的选择以便于充分利用带宽和连接。 -
错误通知的管理
在HTTP1.1中新增了24个错误状态响应码,如409(Conflict)表示请求的资源与资源的当前状态发生冲突;410(Gone)表示服务器上的某个资源被永久性的删除。 -
Host头处理
在HTTP1.0中认为每台服务器都绑定一个唯一的IP地址,因此,请求消息中的URL并没有传递主机名(hostname)。但随着虚拟主机技术的发展,在一台物理服务器上可以存在多个虚拟主机(Multi-homed Web Servers),并且它们共享一个IP地址。HTTP1.1的请求消息和响应消息都应支持Host头域,且请求消息中如果没有Host头域会报告一个错误(400 Bad Request)。 -
长连接
HTTP 1.1支持长连接(PersistentConnection)和请求的流水线(Pipelining)处理,在一个TCP连接上可以传送多个HTTP请求和响应,减少了建立和关闭连接的消耗和延迟,在HTTP1.1中默认开启Connection: keep-alive,一定程度上弥补了HTTP1.0每次请求都要创建连接的缺点。
Pipelining会造成队头阻塞
队头阻塞是指当顺序发送的请求序列中的一个请求因为某种原因被阻塞时,在后面排队的所有请求也一并被阻塞,会导致客户端迟迟收不到数据。
针对队头阻塞:
1.将同一页面的资源分散到不同域名下,提升连接上限。虽然能公用一个 TCP 管道,但是在一个管道中同一时刻只能处理一个请求,在当前的请求没有结束之前,其他的请求只能处于阻塞状态。
2.减少请求数量
3.内联一些资源:css、base64 图片等
4.合并小文件减少资源数
SPDY: HTTP1.x的优化
SPDY位于HTTP之下,TCP和SSL之上,这样可以轻松兼容老版本的HTTP协议(将HTTP1.x的内容封装成一种新的frame格式),同时可以使用已有的SSL功能。
-
降低延迟
针对HTTP高延迟的问题,SPDY优雅的采取了多路复用(multiplexing)。多路复用通过多个请求stream共享一个tcp连接的方式,解决了HOL blocking的问题,降低了延迟同时提高了带宽的利用率。 -
请求优先级(request prioritization)
多路复用带来一个新的问题是,在连接共享的基础之上有可能会导致关键请求被阻塞。SPDY允许给每个request设置优先级,这样重要的请求就会优先得到响应。比如浏览器加载首页,首页的html内容应该优先展示,之后才是各种静态资源文件,脚本文件等加载,这样可以保证用户能第一时间看到网页内容。 -
header压缩
前面提到HTTP1.x的header很多时候都是重复多余的。选择合适的压缩算法可以减小包的大小和数量。 -
基于HTTPS的加密协议传输
大大提高了传输数据的可靠性。 -
服务端推送(server push)
采用了SPDY的网页,例如我的网页有一个style.css的请求,在客户端收到style.css数据的同时,服务端会将style.js的文件推送给客户端,当客户端再次尝试获取style.js时就可以直接从缓存中获取到,不用再发请求了。
2.0 和 SPDY 的区别
2.0 和 1.X 的区别
-
新的二进制格式(Binary Format),HTTP1.x的解析是基于文本。基于文本协议的格式解析存在天然缺陷,文本的表现形式有多样性,要做到健壮性考虑的场景必然很多,二进制则不同,只认0和1的组合。基于这种考虑HTTP2.0的协议解析决定采用二进制格式,实现方便且健壮。
-
多路复用(MultiPlexing),即连接共享,即每一个request都是是用作连接共享机制的。一个request对应一个id,这样一个连接上可以有多个request,每个连接的request可以随机的混杂在一起,接收方可以根据request的 id将request再归属到各自不同的服务端请求里面。
-
header压缩,如上文中所言,对前面提到过HTTP1.x的header带有大量信息,而且每次都要重复发送,HTTP2.0使用encoder来减少需要传输的header大小,通讯双方各自cache一份header fields表,既避免了重复header的传输,又减小了需要传输的大小。
-
服务端推送(server push),同SPDY一样,HTTP2.0也具有server push功能。
4.状态码
类别
- 1XX:信息性状态码(接收的请求正在处理)
- 2XX:成功状态码 (请求正常处理完毕)
- 3XX:重定向状态码 (需要进行附加操作以完成请求)
- 4XX:客户端错误状态码 (服务器无法处理请求)
- 5XX:服务端错误状态码 (服务器处理请求出错)
摘要
-
200 OK,请求被正常处理
-
204 Not Content 响应报文不包含注意部分
-
206 Partial Content 客户端进行了范围请求
-
301 Moved Permanently 永久重定向
-
302 Found 临时重定向,请求的资源被分配了新的URI,希望用户能使用新的URI访问
-
303 See Other
-
304 Not Modified 与请求报文包含If-Match、If-Modified-Since等对应,返回304状态码的报文不包含主体部分
-
307 Temporary Redirect 临时重定向
-
400 Bad Request 请求报文中存在语法错误
-
401 Unauthorized 需要有通过HTTP认证的认证信息
-
403 Forbidden 对请求资源的访问被拒绝
-
404 Not Found 服务器无法找到请求的资源
-
500 Internal Server Error,服务器执行请求时出错
-
503 Service Unavailable,服务器暂时处于超负载或正在停机维护,无法处理请求