房产销售网站开发文档,网站建设 探索,网站欢迎界面源码,企业网站建设参考文献作者 | 神说要有光来源 | 神光的编程秘籍大家都知道 HTTP 的底层是 TCP#xff0c;但是可能仅限于知道#xff0c;并不是真正理解它们的关系。平时我们用 chrome devtools 的 Network 工具也只是能分析 HTTP 请求#xff1a;TCP 层的东西看不见摸不着的#xff0c;所以对它… 作者 | 神说要有光来源 | 神光的编程秘籍大家都知道 HTTP 的底层是 TCP但是可能仅限于知道并不是真正理解它们的关系。平时我们用 chrome devtools 的 Network 工具也只是能分析 HTTP 请求TCP 层的东西看不见摸不着的所以对它的理解也模模糊糊。那怎么能看到 TCP 层的数据包来理清 TCP 和 HTTP 的关系呢这里推荐一个抓包工具 WireShark它能抓取 TCP 层的包。今天我们就用它来抓包分析下 TCP 和 HTTP 吧首先我们准备这样一段服务端代码const express require(express)const app express()app.get(/, function (req, res) {res.setHeader(Connection, close)res.end(hello world);
})app.listen(4000)用 express 起了一个服务监听 4000 端口处理路径为 / 的 get 请求返回 hello world 的响应体并设置 Connection: close 的 header。浏览器访问下header 和 body 都符合预期。那 TCP 层都做了什么呢我们用 WireShark 抓包分析下打开 WireShark 后会看到有个设置按钮。因为我们访问的是 localhost: 4000所以这里选择本地回环地址那个虚拟网卡并输入抓包过滤条件为 port 4000点击 start 开始录制然后刷新一下浏览器这样就能看到抓到的 TCP 数据包我们一一分析下。在分析之前需要了解一些 TCP 基础知识TCP 的头部是这样的TCP 是从端口到端口的传输协议所以开始是源端口和目的端口。接下来是序列号sequence number表示当前包的序号后面是确认的序列号acknowledgment number表示我收到了序号为 xxx 的包。然后红框标出的部分是 flags 标识位通过 0、1 表示有没有这里我们只会用到其中的 SYN、ACK、FINSYN请求建立一个连接说明这是链接的开始ACK表示 ack number 是否是有效的FIN表示本端要断开链接了说明这是链接的结束有了这些我们就知道怎么区分 TCP 链接的开始和结束了。再看一下抓到的包有 SYN 标志位的是连接的开始有 FIN 标志位的是连接的结束所以我们分为 3 段来看首先是连接开始的部分大家听过 TCP 的三次握手么说的就是这个。其中有一个端口是 4000这个是服务的端口那另一个端口 57454 明显就是浏览器的端口。首先是浏览器向服务器发送了一个 SYN 的 TCP 请求表示希望建立连接序列号 Seq 是 0。严格来说序列号的相对值是 0绝对值是 2454579144。然后服务器向浏览器发送了一个 SYN 的 TCP 请求表示希望建立连接ACK 是 1代表现在的 ack number 是有效的这里 ack number 的相对值是 1绝对值是 2454579145不就是上个 TCP 数据包的 seq 加 1 么TCP 连接中就是通过返回 seq number 1 作为 ack number 来确认收到的。然后又返回了一个 seq number 给浏览器相对值是 0 绝对值是 2765691269。浏览器收到后返回了一个 TCP 数据包给服务器ack number 自然是 2765691270代表收到了连接请求。这样浏览器和服务器各自向对方发送了 SYN 的建立连接请求并且都收到了对方的确认那么 TCP 连接就建立成功了。这就是 TCP 三次握手的原理趁热打铁来看下四次挥手的部分浏览器向服务器发送了有 FIN 标志位的数据包表示要断开连接然后服务端返回了 ACK 的包表示确认。之后服务端发送了 FIN 标志位的数据包给浏览器表示要断开连接浏览器也返回了 ACK 的包表示确认。这样就完成了四次挥手的过程。当然具体确认的还是靠 ack number seq number 1 来实现的和上面的一样就不展开了我们通过抓包理清了 TCP 连接建立和连接的过程。那么为什么握手是三次挥手是四次呢因为挥手是一个 FIN一个 ACK一个 FIN ACK一个 ACK而握手是一个 SYN一个 ACK SYN一个 ACK不过是因为握手时把 ACK 和 SYN 合并到一个数据包了而已。那挥手时能合并成三次么不能因为有两个 ack number怎么合并冲突了而握手时只有一个 ack number自然可以合并。接下来再来看下连接建立后的 http 请求和响应吧其实一次 HTTP 请求响应会有四个 TCP 数据包其中两个数据包与滑动窗口有关这里先不展开了。相对值是 ack number seq number 1 没错但是绝对值不是绝对值 2454579855 2454579145 710也就是 ack number seq number segment len。这些细节暂时不用深究。总之我们知道了HTTP 的请求和响应是通过序列号关联在一起的。就算同一个 TCP 链接并行发送多个 HTTP 的请求和响应它们也能找到各自对应的那个。就是通过这个 seq number 和 ack number。这里为啥链接建立了发送了一个请求就断掉了呢我刷新浏览器请求了两次发现经历了两次连接的建立、http 请求响应、连接断开这是因为我设置了 Connection:close 的 header它的作用就是一次 http 请求响应结束就断开 TCP 链接。我们改成 HTTP 1.1 支持的 keep-alive 试试设置 Connection 为 keep-alive然后设置 keep-alive 的细节为 timeout 10 也就是 10s 后断开。重启服务器再刷新下浏览器试试可以看到在一个 TCP 连接内发送了多次 http 请求响应。通过 SYN 开始FIN 结束这就是 keep-alive 的作用。细心的同学会发现只是浏览器向服务器发送了 FIN 数据包服务器没有发给浏览器 FIN 数据包。这是因为 keep-alive 的 header 只是控制的浏览器的断开连接的行为服务器的断开连接逻辑是独立的。这样我们就理清了 HTTP 在 TCP 层面的流程连接的建立、断开请求响应还有 keep-alive。总结我们平时都是分析 HTTP 请求响应TCP 对我们来说看不见摸不着的理解的模模糊糊。所以今天我们用 WireShark 抓了下 TCP 的包来理清了 TCP 和 HTTP 的关系。TCP 是从一个端口到另一个端口的传输控制协议TCP header 中有序列号 seq number、确认序列号 ack number还有几个标志位SYN 标志位代表请求建立连接ACK 标志位代表当前确认序列号是有效的。FIN 标志位代表请求断开连接然后我们抓了 localhost:4000 的包分析了下 HTTP 请求的 TCP 流程理清了三次握手SYN、SYN ACK、ACK四次挥手FIN、ACK、FIN ACK、ACK的连接建立、断开的流程。知道了为什么不能三次挥手因为两个 ACK 冲突了然后还理清了同一个 TCP 连接传输的多个 HTTP 请求响应是通过 seq number 和 ack number 来关联的。之后我们分别测试了 Connectionclose 和 Connectionkeep-alive 的情况发现确实 keep-alive 能减少频繁的连接建立和断开能复用同一个 TCP 链接。HTTP 是通过 TCP 完成端口到端口的数据传输的。一个 TCP 连接可以传输多个 HTTP 请求、响应。请求和响应的关联是通过 TCP 包的序列号 seq。理清了 TCP 和 HTTP 的关系你是否对 HTTP 的理解更深了呢往期推荐40 张图 详解 Docker 容器监控剖析 kubernetes 集群内部 DNS 解析原理Docker 镜像和容器的导入导出及常用命令如何从 Docker 镜像里提取 dockerfile点分享点收藏点点赞点在看