服务器网站备案,济南做网站的好公司,河南智慧团建官网,第五次普查数据自网站怎么做HTTP 浏览器做的第一步工作是解析URL 首先浏览器做的第一步工作就是要对URL进行解析#xff0c;从而生成发送给 web 服务器的请求信息。 所以图中长长的URL实际上是请求服务器里的文件资源。 如果图中的蓝色部分URL元素省略了#xff0c;那应该请求哪个文件呢#xff1f; 当… HTTP 浏览器做的第一步工作是解析URL 首先浏览器做的第一步工作就是要对URL进行解析从而生成发送给 web 服务器的请求信息。 所以图中长长的URL实际上是请求服务器里的文件资源。 如果图中的蓝色部分URL元素省略了那应该请求哪个文件呢 当没有路径名时就代表访问根目录下事先设置的默认文件也就是 /index.html 或者 /default.html 这样就不会发生混乱了。 生成HTTP请求信息 对URL进行解析后浏览器确定了 Web 服务器和文件名接下来就是根据这些信息生成HTTP请求消息。 DNS-真实地址查询
通过浏览器解析URL并生成HTTP消息后需要委托操作系统将消息发送给Web服务器。
但是在发送前还有一项工作需要完成那就是查询服务器域名对应的IP地址因为委托操作系统发送消息时必须提供通信对象的IP地址。
比如我们在打电话的时候必须要直到对方的电话号码但由于电话号码难以记忆所以通常我们会将电话号姓名保存在通讯录里。
所以有一种服务器就专门保存了Web服务器域名与IP的对应关系即DNS服务器。 域名的层级关系 DNS中的域名都是用句点来分隔的比如 www.server.com这里的句点代表不同层次之间的界限。
在域名汇总越靠右的位置表示其层级越高。(外国的使用习惯)
实际上域名最后还有一个点比如 www.server.com.这个最后的点代表根域名。也就是 . 根域是在最顶层它的下一层就是 .com 顶级域在下面是 server.com 。
所以域名的层级关系类似一个树状结构
根 DNS 服务器 . 顶级域 DNS 服务器 .com权威 DNS 服务器 server.com 根域的DNS服务器信息保存在互联网中所有的DNS服务器中。
这样一来任何DNS服务器就都可以找到并访问根域DNS服务器了。
因此客户端主要能够找到任意一台DNS服务器就可以通过它找到根域DNS服务器然后再顺藤摸瓜找到位于下层的某台目标DNS服务器。 域名解析的工作流程 客户端首先会发出一个DNS请求问www.server.com的 IP 是什么并发给本地 DNS 服务器也就是客户端的TCP/IP设置中填写的DNS服务器地址。本地域名服务器收到客户端的请求后如果缓存里的表格能找到www.server.com则它直接返回IP地址。如果没有本地DNS会去问它的根域名服务器。根域名服务器是最高层次的它不会直接用于域名解析但能指明一条路。根DNS收到来自本地DNS的请求后发现后置的是.com说“www.server.com这个域名归.com区域管理我给你.com顶级域名的地址你去问问他吧”。本地DNS收到顶级域名服务器的地址后发起请求问顶级域名服务器“你能告诉我www.server.com的IP地址吗”。顶级域名服务器说“我给你负责www.server.com区域的权威DNS服务器的地址你去问问它吧”。本地DNS于是转向问权威DNS服务器“www.server.com对应的IP盘地址是什么”server.com的权威DNS服务器它是域名解析结果的原出处。权威DNS服务器查询后将对应的IP地址 x.x.x.x告诉本地DNS。本地DNS再将IP地址返回客户端客户端和目标建立连接。 DNS 域名解析的整个过程就和我们日常生活中找人问路的过程类似只指路不带路。 那是不是每次解析域名都要经过那么多的步骤呢 当然不是了还有缓存这个东西。
浏览器会先看自身有没有对这个域名的缓存如果有就直接返回如果没有就去问操作系统操作系统也会去看自己的缓存如果有就直接返回如果没有再去 hosts 文件看也没有才会去问「本地 DNS 服务器」。 协议栈-指南帮手
通过DNS获取到IP后就可以把HTTP的传输工作交给操作系统中的协议栈。
协议栈的内部分为几个部分分别承担着不同的工作。上下关系是有一定的规则的上面的部分会向下面的部分委托工作下面的部分收到委托的工作并执行。 应用程序(浏览器)通过调用socket库来委托协议栈工作。协议栈的上部分有两块分别是负责收发数据的TCP和UDP协议这两个传输协议会接受应用层的委托执行收发数据的操作。
协议栈的下面一半是用IP协议控制网络包收发操作在互联网上传数据时数据会被切分为一块块的网络包而将网络包发送给对方的操作就是由IP负责的。
此外IP中还包括ICMP协议和ARP协议
ICMP 用于告知网络包传送过程中产生的错误以及各种控制信息ARP 用于根据IP地址查询相应的以太网MAC地址。
IP下面的网卡驱动程序负责控制网卡硬件而最下面的网卡负责完成实际的收发操作也就是对网线中的信号执行发送和接收操作。 TCP-可靠传输
TCP报文头部格式 首先、源端口号和目标端口号是不可少的如果没有这两个端口号数据就不知道应该发送给哪个应用。
接下来有包的序号这个是用来解决包乱序的问题。
确认序列的目的是确认发出去对方是否收到。如果没有收到就应该重新发送直到送达这个是为了解决丢包问题。
接下来还有一些状态位。例如 SYN 是发起一个连接ACK是回复RST是重新连接FIN是结束连接等。TCP是面向连接的因而双方要维护连接的状态这些带状态的包的发送会引起双方的状态变化。 还有一个重要的就是窗口大小。TCP要做流量控制通信双方各声明一个窗口(缓存大小)标识自己当前能够处理的能力别发送太快也别太慢。
除了做流量控制外TCP还会做拥塞控制。 TCP传输数据之前需要三次握手建立连接 在HTTP传输数据之前首先需要TCP建立连接TCP连接的建立通常称为三次握手。
这个所谓的 连接 只是双方计算机里维护的一个状态机在建立连接的过程中双方的状态变化时序图如下 一开始客户端和服务端都处于 CLOSED 状态先是服务端主动监听某个窗口处于 LISTEN 状态。然后客户端主动发起连接 SYN 之后处于 SYN-SENT 状态。服务端收到发起的连接返回 SYN 并且 ACK 客户端的 SYN 之后处于 SYN-RCVD 状态。客户端收到服务端发送的SYN和ACK后发送对SYN确认的ACK之后处于 ESTABLISHED 状态因为它一发一收成功了。服务端收到 ACK 的 ACK 后处于 ESTABLISHED 状态因为它也一发一收成功了。 三次握手的目的是确保双方都有发送和接收的能力。 TCP分割数据 如果HTTP请求消息比较长超过了MSS的长度这时 TCP 就需要把 HTTP 的数据拆解成一块块的数据发送而不是一次性发送所有数据。 MTU一个网络包的最大长度以太网中一般为 1500 字节MSS除去 IP 和 TCP 头部后一个网络包所能容纳的TCP数据的最大长度。
数据会被以MSS的长度为单位进行划分拆分出来的每一块数据都会被放进单独的网络包中。也就是在每个被拆分的数据加上TCP头部信息然后交给IP模块来发送数据。 TCP报文生成 TCP协议里有两个端口一个是浏览器监听的窗口(通常是随机生成的)一个是 Web服务器监听的端口 (HTTP默认端口号是 80 HTTPS默认端口号是 433 )
双方建立了连接后TCP报文中的数据部分就是存放HTTP头部 数据组装好 TCP 报文后就需要交给下面的网络层处理。 IP-远程定位
TCP模块在执行连接、收发、断开等各阶段操作时就需要委托IP模块将数据封装成网络包发送给通信对象。 IP包头格式 在IP协议里面需要有源地址IP和目标地址IP
源地址IP客户端输出的IP地址目标地址通过DNS域名解析到的Web服务器IP。
因为HTTP是经过TCP传输的所以在IP包头的协议号要填写为06 十六进制表示协议为TCP。 IP报文生成 至此网络包的报文如下图 MAC-两点传输
生成IP头部之后接下来网络包还需要在IP头部的前面加上MAC头部。 MAC包头格式 MAC头部是以太网使用的头部它包含了接收方和发送方的MAC地址等信息。 在MAC包头里需要发送方MAC地址和接收方目标MAC地址用于两点之间的传输。
一般在TCP/IP通信里MAC包头的协议类型只使用
0800IP协议0806ARP协议 MAC发送方和接收方如何确认 发送方的MAC地址获取比较简单MAC地址是在网卡生产时写入到ROM里的只要把这个值读取出来写入到MAC头部就可以了。
接收方的MAC地址就有点复杂只要告诉以太网对方的MAC地址以太网就会帮我们把包发送过去那么很显然这里应该填写对方的MAC地址。
所以得先搞清楚应该把包发给谁这个只需要查一下路由表就知道了。在路由表中找到匹配的条目然后把包发给Gateway列中的IP地址就行了 既然知道发给谁该如何获取对方的MAC地址呢 此时就需要ARP协议帮我们找到路由器的MAC地址。 ARP协议会在以太网中以广播的形式对以太网所有的设备喊出“这个IP地址是谁的请把MAC地址告诉我” 然后子网中的设备如果确认是自己的IP就是回复MAC地址。然后将这个MAC地址写入到MAC头部MAC头部就完成了。
后续操作系统会把本次查询的结果放到一块叫做ARP缓存的内存空间留着以后用不过缓存的时间只有几分钟。
也就是说在发包时
先查询ARP缓存如果其中已经保存了对方的MAC地址就不需要发送ARP查询直接使用ARP缓存中的地址。而当ARP缓存中不存在对方MAC地址时则发送ARP广播查询。 查看ARP缓存内容 在Linux系统中我们可以使用 arp -a 命令来查看ARP缓存的内容。 MAC报文生成 网卡-出口
网络包只是存放在内存中的一串二进制数字信息没有办法直接发送给对方。因此我们需要将数字信息转换为电信号才能在网线上传输也就是说这才是真正的数据发送过程。
负责执行这一块操作的是网卡要控制网卡还需要网卡驱动程序。
网卡驱动获取网络包后会将其复制到网卡内的缓冲区中接着会在其开头加上报头和起始帧分界符在末尾加上用于检测错误的帧校验序列。 起始分界符是一个用来表示包起始位置的标记末尾的 FCS 帧校验序列用来检查包传输过程是否有损坏 最后网卡会将包转换为电信号通过网线发送出去。 交换机-送别
交换机的设计是将网络包原样转发到目的地。交换机工作在MAC层也称为二级网络设备 交换机的包接收操作 首先电信号到达网线接口交换机里的模块进行接收接下来交换机里的模块将电信号转换为数字信号。
然后通过包末尾的FCS校验错误如果没问题则放到缓冲区。这部分操作基本和计算机的网卡相同但交换机的工作方式和网卡不同。
计算机的网卡本身具有MAC地址并通过核对收到的包的接收方MAC地址判断是不是发给自己的如果不是发给自己的则丢弃相对的交换机的端口不核对接收方MAC地址而是直接接受所有的包并存放到缓冲区中。因此和网卡不同交换机的端口不具有MAC地址。
将包存入缓冲区后接下来需要查询一下这个包的接收方MAC地址是否已经在MAC地址表中有记录。
交换机的MAC地址表主要包含两个信息
一个是设备的MAC地址另一个是该设备连接在交换机的哪个端口上 如果收到的包的接收方的MAC地址为 00-02-B3-1C-9C-F9则与图中表中的第 3 行匹配根据端口列的信息可知这个地址位于 3 号端口上然后就可以通过交换电路将包发送到相应的端口了。 所以交换机根据MAC地址表查询MAC地址然后将信号发送到相应的端口。 当MAC地址表找不到指定的MAC地址会怎么样 地址表中找不到指定的MAC地址。这可能是因为具有该地址的设备还没有向交换机发送过包或者这个设备一段时间没有工作导致地址被从地址表中删除了。
这种情况下交换机无法判断应该把包转发到哪个端口只能将包转发到除了源端口之外的所有端口上无论该设备连接在哪个端口上都能收到这个包。
这样做不会产生什么问题因为以太网的设计本来就是将包发送到整个网络的然后只有相应的接收者才接收包而其他设备则会忽略这个包。
那么这样做会发送多余的包会不会造成网络阻塞呢
其实完全不用担心因为发送了包之后目标设备会做出响应只要返回了响应包交换机就可以将它的地址写入到MAC地址表下次也就不需要把包发到所有的端口了。
此外如果接收方MAC地址是一个广播地址那么交换机会将包发送到除源端口之外的所有端口以下两个属于广播地址
MAC地址中的 FF:FF:FF:FF:FF:FFIP地址中的255.255.255.255 路由器-出境大门 路由器与交换机的区别 网络包经过交换机后到达了路由器并且在此被转发到了下一个路由器或目标设备。
这一步转发的工作原理和交换机类似也是通过查表判断包转发的目标。
不过在具体操作过程上交换机和路由器是有区别的。
因为路由器是基于IP设计的俗称三级网络设备路由器的各个端口都具有MAC地址和IP地址而交换机是基于以太网设计的俗称二级网络设备交换机的端口不具有MAC地址。 路由器的基本原理 路由器的端口具有MAC地址因为它就能够成为以太网的发送方和接收方同时还具有IP地址从这个意义上来说它和计算机的网卡是一样的。
当转发包时首先路由器端口会接收发给自己的以太网包然后路由表查询转发目标再由相应的端口作为发送方将以太网包发出去。 路由器的包接收操作 首先电信号到达网线接口部分路由器中的模块会将电信号转成数字信号然后通过包末尾的 FCS 进行错误校验。
如果没问题则检查 MAC 头部中的接收方 MAC 地址看看是不是发给自己的包如果是就放到接收缓冲区中否则就丢弃这个包。
总的来说路由器的端口都具有 MAC 地址只接收与自身地址匹配的包遇到不匹配的包则直接丢弃。 查询路由表确定输出端口 完成包接收操作之后路由器就会去掉包开头的 MAC 头部。
MAC 头部的作用就是将包送达路由器其中的接收方 MAC 地址就是路由器端口的 MAC 地址。因此当包到达路由器之后MAC 头部的任务就完成了于是 MAC 头部就会被丢弃。
接下来路由器会根据 MAC 头部后方的 IP 头部中的内容进行包的转发操作。
转发操作分为几个阶段首先是查询路由表判断转发目标。 具体的工作流程根据上图举个例子。
假设地址为 10.10.1.101 的计算机要向地址为 192.168.1.100 的服务器发送一个包这个包先到达图中的路由器。
判断转发目标的第一步就是根据包的接收方 IP 地址查询路由表中的目标地址栏以找到相匹配的记录。
路由匹配和前面讲的一样每个条目的子网掩码和 192.168.1.100 IP 做 与运算后得到的结果与对应条目的目标地址进行匹配如果匹配就会作为候选转发目标如果不匹配就继续与下个条目进行路由匹配。
如第二条目的子网掩码 255.255.255.0 与 192.168.1.100 IP 做 与运算后得到结果是 192.168.1.0 这与第二条目的目标地址 192.168.1.0 匹配该第二条目记录就会被作为转发目标。
实在找不到匹配路由时就会选择默认路由路由表中子网掩码为 0.0.0.0 的记录表示「默认路由」。 路由器的发送操作 接下来就会进入包的发送操作。
首先我们需要根据路由表的网关列判断对方的地址。
如果网关是一个 IP 地址则这个IP 地址就是我们要转发到的目标地址还未抵达终点还需继续需要路由器转发。如果网关为空则 IP 头部中的接收方 IP 地址就是要转发到的目标地址也是就终于找到 IP 包头里的目标地址了说明已抵达终点。
知道对方的 IP 地址之后接下来需要通过 ARP 协议根据 IP 地址查询 MAC 地址并将查询的结果作为接收方 MAC 地址。
路由器也有 ARP 缓存因此首先会在 ARP 缓存中查询如果找不到则发送 ARP 查询请求。
接下来是发送方 MAC 地址字段这里填写输出端口的 MAC 地址。还有一个以太类型字段填写 0800 十六进制表示 IP 协议。
网络包完成后接下来会将其转换成电信号并通过端口发送出去。这一步的工作过程和计算机也是相同的。
发送出去的网络包会通过交换机到达下一个路由器。由于接收方 MAC 地址就是下一个路由器的地址所以交换机会根据这一地址将包传输到下一个路由器。
接下来下一个路由器会将包转发给再下一个路由器经过层层转发之后网络包就到达了最终的目的地。
PS:在网络包传输的过程中源 IP 和目标 IP 始终是不会变的一直变化的是 MAC 地址因为需要 MAC 地址在以太网内进行两个设备之间的包传输。 服务器与客户端-互相扒皮 数据包抵达服务器后服务器会先扒开数据包的 MAC 头部查看是否和服务器自己的 MAC 地址符合符合就将包收起来。
接着继续扒开数据包的 IP 头发现 IP 地址符合根据 IP 头中协议项知道自己上层是 TCP 协议。 于是扒开 TCP 的头里面有序列号需要看一看这个序列包是不是我想要的如果是就放入缓存中然后返回一个 ACK如果不是就丢弃。TCP 头部里面还有端口号 HTTP 的服务器正在监听这个端口号。
于是服务器自然就知道是 HTTP 进程想要这个包于是就将包发给 HTTP 进程。
服务器的 HTTP 进程看到原来这个请求是要访问一个页面于是就把这个网页封装在 HTTP 响应报文里。
HTTP 响应报文也需要穿上 TCP、IP、MAC 头部不过这次是源地址是服务器 IP 地址目的地址是客户端 IP 地址。
穿好头部衣服后从网卡出去交由交换机转发到出城的路由器路由器就把响应数据包发到了下一个路由器就这样跳啊跳。
最后跳到了客户端的城门把守的路由器路由器扒开 IP 头部发现是要找城内的人于是又把包发给了城内的交换机再由交换机转发到客户端。