# 1. HTTP概述
HTTP协议(HyperText Transfer Protocol,超文本传输协议)是因特网上应用最为广泛的一种网络传输协议。
设计HTTP最初的目的是为了提供一种发布和接收HTML页面的方法,它是一个基于 TCP/IP 通信协议来传输数据的应用层协议。
要注意的点就是:
- 一句话概述HTTP
- HTTP经典的几个版本
- HTTP存在的位置
# 1.1 一句话概述HTTP
【面试时问起:一句话概述HTTP协议】🌟🌟🌟🌟
HTTP 是一个在计算机世界里专门在两点之间传输文字、图片、音频、视频等超文本数据的约定和规范。
(HTTP通常跑在TCP/IP协议栈之上,依靠IP协议实现寻址和路由、TCP协议实现可靠数据传输、DNS协议实现域名查找、SSL/TLS协议实现安全通信。当然,WebSocket、HTTPDNS依赖于HTTP。——「进击的前端工程师」HTTP的世界观(附HTTP/3中文翻译)-童欧巴)
# 1.2 HTTP经典的几个版本
- 第一版 HTTP/0.9 于1990年问世,并没有作为正式的标准被建立。
- 作为正式的标准被建立是 HTTP/1.0,于1996年5月发布。
- 目前主流的版本是 HTTP/1.1,于1997年1月发布。
- 2015年5月 正式发布HTTP/2。(不叫HTTP/2.0,是因为标准委员会不打算发布子版本,下一个版本直接是HTTP/3)
# 1.3 HTTP存在的位置
处于 TCP/IP 网络分层模型中的第一层应用层。
应用层的其它协议还有:
- FTP:文件传输协议,用来在客户机和FTP服务器之间传输文件。
- DNS域名系统:提供域名到IP地址之间的解析服务。
- SMTP:邮件发送协议,用户通过SMTP服务器发送邮件。
- DHCP:动态主机配置协议,DHCP服务器为客户机动态分配IP地址。
- POP3:邮件接收协议,用于从POP3服务器接收邮件。
【面试时问起一般答前面三个就够了】🌟🌟
# 2. HTTP特点及缺点
# 2.1 HTTP特点
常问知识点,重要指数:🌟🌟🌟🌟🌟
- HTTP协议支持客户端/服务端模式,也是一种请求/响应模式的协议。
- 灵活可扩展:一个是语义上的自由,只规定了基本格式,其它的各部分没有严格的限制;第二个它允许传输任意类型的数据对象,例如文本、图片、音频等,传输的类型由Content-Type加以标记。
- 可靠传输,HTTP 基于 TCP/IP,因此把这一特性继承了下来。
- 无状态,也就是说HTTP请求不具备保存之前发送过的请求或响应的功能,每一次请求都是独立无关的。
如果还要的话,可以答一下持久连接:
- 概念:建立一次TCP连接即可进行多次请求或响应的交互
- 产生原因:HTTP的初始版本是每进行一次HTTP通信就要断开一次TCP连接,下次再进行的时候又要重新连接断开。再如今请求的资源越来越大,每次请求如果都有无谓TCP连接和断开是很大的开销。
- 特点:只要有一方没有明确的提出断开连接,则保持TCP连接状态。
- 优点:减少了TCP连接和断开的造成的额外开销,减轻了服务端的负载,Web页面加载变快
- 注意点:在HTTP/1.1中所有的连接默认都是持久连接的(也就是首部字段 Connection: keep-alive,若是想要关闭则将值设置为 close),但是HTTP/1.0并未标准化
(另外其实还有一个管线化的特点,同时并行发送多个请求,而不必等前一个请求完毕才能发送下一个。但是因为各种原因被各大厂商废弃了)
# 2.2 HTTP的缺点
常问知识点,重要指数:🌟🌟🌟🌟🌟
简单来说:
- 明文传输(不加密),内容可能被窃听。
- 无法验证报文的完整性,内容可能被篡改。
- 不验证通信方的身份,有可能遭遇伪装。
- 无状态,它是缺点也是优点吧,分不同的场景。
- 队头阻塞。
详细来说:
- 明文传输(不加密),内容可能被窃听。协议里的报文不使用二进制数据,而是文本形式
- 无法验证报文的完整性,内容可能被篡改。这里说的完整性也就是指信息的准确度 因为接收方或者发送方没有办法确认对方发送过来的数据在中间有没有被篡改
- 不验证通信方的身份,有可能遭遇伪装。因为HTTP协议中不会对通信方进行确认 任何人都可以发送请求,而且服务器它对收到的请求也不会进行确认,只要收到了请求就会返回一个响应(当然这个只是在发送端的IP地址或者端口号没被Web服务器设定限制访问的前提下)
- 无状态,不具备保存之前发送过的请求或响应的功能。它是缺点也是优点吧:
- 对于一些长连接的场景需要保存上下文信息,以免传输重复的数据。
- 对于一些应用只是为了获取数据不需要保存上下文信息,无状态减少了网络开销。
- 队头阻塞:
- 其根本原因在于HTTP是基于 请求-响应 的模型,在同一个TCP长连接中,前一个请求没有得到响应,后面的请求就会被阻塞。
- 用并发连接 和 域名分片 来解决了这个问题。但并不是从HTTP本身的层面来解决的,只是增加了 TCP 连接,分摊风险而已。
- HTTP/2中的多路复用从HTTP本身的层面解决了这个问题
- 和TCP队头阻塞的区别:TCP传输的单位是数据包,它的队头阻塞表示的是前一个报文没有收到便不会将下一个报文上传给HTTP。而HTTP队头阻塞是在 请求-响应 层面,前一个请求还没有处理完,后面的请求就被阻塞。
# 3. HTTP请求方法
# 3.1 方法种类
常问知识点,重要指数:🌟🌟🌟🌟🌟
-
GET:获取资源,幂等操作
-
HEAD:获取报文首部,和GET很像但是不返回报文主体,幂等操作
-
POST: 创建或更新资源,非幂等操作
-
PUT: 创建或更新资源本身,幂等操作
-
PATCH:对资源进行局部更新,幂等操作
-
DELETE:删除资源,和PUT功能相反,幂等操作
-
OPTIONS:查询服务器端支持的HTTP方法种类(幂等操作):
请求 OPTIONS * HTTP/1.1
Host: lindaidai.wang响应 HTTP/1.1 200 OK
Allow: GET, POST, HEAD, OPTIONS
(返回服务器支持的方法) -
CONNECT:建立连接隧道,用于代理服务器,幂等操作
