前言
一面要讲的内容:
HTTP协议的主要特点
HTTP报文的组成部分
HTTP方法
get 和 post的区别
HTTP状态码
什么是持久连接
什么是管线化
二面要讲的内容;
缓存
CSRF攻击
HTTP协议的主要特点
简单快速
灵活
无连接
无状态
通常我们要答出以上四个内容。如果实在记不住,一定要记得后面的两个:无连接、无状态。
我们分别来解释一下。
简单快速
简单:每个资源(比如图片、页面)都通过 url 来定位。这都是固定的,在http协议中,处理起来也比较简单,想访问什么资源,直接输入url即可。
灵活
http协议的头部有一个数据类型
,通过http协议,就可以完成不同数据类型的传输。
无连接
连接一次,就会断开,不会继续保持连接。
无状态
客户端和服务器端是两种身份。第一次请求结束后,就断开了,第二次请求时,服务器端并没有记住之前的状态,也就是说,服务器端无法区分客户端是否为同一个人、同一个身份。
有的时候,我们访问网站时,网站能记住我们的账号,这个是通过其他的手段(比如 session)做到的,并不是http协议能做到的。
HTTP报文的组成部分
在回答此问题时,我们要按照顺序回答:
先回答的是,http报文包括:请求报文和响应报文。
再回答的是,每个报文包含什么部分。
最后回答,每个部分的内容是什么
请求报文包括:
请求行:包括请求方法、请求的url、http协议及版本。
请求头:一大堆的键值对。
空行指的是:当服务器在解析请求头的时候,如果遇到了空行,则表明,后面的内容是请求体。
请求体:数据部分。
响应报文包括:
状态行:http协议及版本、状态码及状态描述。
响应头
空行
响应体
HTTP方法
包括:
GET:获取资源
POST:传输资源
put:更新资源
DELETE:删除资源
HEAD:获得报文首部
HTTP方法有很多,但是上面这五个方法,要求在面试时全部说出来,不要漏掉。
get 和 post 比较常见。
put 和 delete 在实际应用中用的很少。况且,业务中,一般不删除服务器端的资源。
head 可能偶尔用的到。
get 和 post的区别
区别有很多,如果记不住,面试时,至少要任意答出其中的三四条。
有一点要强调,get是相对不隐私的,而post是相对隐私的。
我们大概要记住以下几点:
1、浏览器在回退时,get不会重新请求,但是post会重新请求。【重要】
2、get请求会被浏览器主动缓存,而post不会。【重要】
3、get请求的参数,会报保留在浏览器的历史记录里,而post不会。做业务时要注意。为了防止CSRF攻击,很多公司把get统一改成了post。
4、get请求在url中传递的参数有大小限制,基本是2kb,不同的浏览器略有不同。而post没有注意。
5、get的参数是直接暴露在url上的,相对不安全。而post是放在请求体中的。
http状态码
http状态码分类:
常见的http状态码:
部分解释:
206的应用:
range
指的是请求的范围,客户端只请求某个大文件里的一部分内容。比如说,如果播放视频地址或音频地址的前面一部分,可以用到206。301:重定向(永久)。
302:重定向(临时)。
304:我这个服务器告诉客户端,你已经有缓存了,不需要从我这里取了。
400和401用的不多。403指的是请求被拒绝。404指的是资源不存在。
持久链接/http长连接
如果你能答出持久链接,这是面试官很想知道的一个点。
轮询:http1.0中,客户端每隔很短的时间,都会对服务器发出请求,查看是否有新的消息,只要轮询速度足够快,例如1秒,就能给人造成交互是实时进行的印象。这种做法是无奈之举,实际上对服务器、客户端双方都造成了大量的性能浪费。
长连接:HTTP1.1中,通过使用Connection:keep-alive进行长连接,。客户端只请求一次,但是服务器会将继续保持连接,当再次请求时,避免了重新建立连接。
注意,HTTP 1.1默认进行持久连接。在一次 TCP 连接中可以完成多个 HTTP 请求,但是对每个请求仍然要单独发 header,Keep-Alive不会永久保持连接,它有一个保持时间,可以在不同的服务器软件(如Apache)中设定这个时间。
长连接中的管线化
如果能答出管线化,则属于加分项。
管线化的原理
长连接时,默认的请求这样的:
请求1 --> 响应1 -->请求2 --> 响应2 --> 请求3 --> 响应3
长连接中的管线化,请求是这样的:
请求1 --> 请求2 --> 请求3 --> 响应1 --> 响应2 --> 响应3
管线化就是,我把现在的请求打包,一次性发过去,你也给我一次响应回来。