本篇文章主要是从运输层协议概述、UDP、TCP、可靠传输的工作原理、TCP首部格式、TCP可靠传输的实现、TCP流量控制、TCP的拥塞控制、TCP的连接管理这几个方面进行解析。不对之处还望指出,喜欢的可以点赞关注一下,谢谢。
一、运输层协议概述
1.进程之间的通信
![](https://img-blog.csdnimg.cn/img_convert/515d2d6680cc11215c69d23b8b53421a.png)
应用进程之间的通信:
-
两个主机进行通信实际上就是两个主机中的应用进程互相通信。
-
应用进程之间的通信又称为端到端的通信。 输层的一个很重要的功能就是复用和分用。应用层不同进程的报文通过不同的端口向下交到运输层,再往下就共用网络层提供的服务。
-
“运输层提供应用进程间的逻辑通信”。“逻辑通信”的意思是:运输层之间的通信好像是沿水平方向传送数据。但事实上这两个运输层之间并没有一条水平方向的物理连接。
![](https://img-blog.csdnimg.cn/img_convert/77d051e6604aaadafe3aba11953dbddb.png)
运输层的主要功能:
两种不同的运输协议:
-
运输层向高层用户屏蔽了下面网络核心的细节(如网络拓扑、所采用的路由选择协议等),它使应用进程看见的就是好像在两个运- 输层实体之间有一条端到端的逻辑通信信道。
-
当运输层采用面向连接的 TCP 协议时,尽管下面的网络是不可靠的(只提供尽最大努力服务),但这种逻辑通信信道就相当于一条全双工的可靠信道。
-
当运输层采用无连接的 UDP 协议时,这种逻辑通信信道是一条不可靠信道。
2.运输层的两个主要协议
TCP/IP 的运输层有两个不同的协议:
TCP与UDP:
-
两个对等运输实体在通信时传送的数据单位叫作运输协议数据单元 TPDU (Transport Protocol Data Unit)。
-
TCP 传送的数据单位协议是 TCP 报文段(segment)
-
UDP 传送的数据单位协议是 UDP 报文或用户数据报。
![](https://img-blog.csdnimg.cn/img_convert/a45ae91917b2e09be13138e9b6406ae7.png)
3.运输层的端口
端口号(protocol port number),简称为端口(port):
软件端口与硬件端口:
TCP 的端口 :
三类端口号:
更多Linux服务器高级开发内容包括C/C++,Linux,Nginx,ZeroMQ,MySQL,Redis,MongoDB,ZK,流媒体,P2P,K8S,Docker,TCP/IP,协程,DPDK多个高级知识点分享。
点击链接:C/C++Linux服务器开发/后台架构师-学习视频
文档资料、电子书籍以及各大企业面试题资料+qun720209036
![](https://img-blog.csdnimg.cn/img_convert/41f086a255e0c21291649edf0ad5e59e.png)
二、用户数据报协议UDP
1.UDP概述
UDP的主要特点:
-
UDP 是无连接的,即发送数据之前不需要建立连接。
-
UDP 使用尽最大努力交付,即不保证可靠交付,同时也不使用拥塞控制。
-
UDP 是面向报文的。UDP 没有拥塞控制,很适合多媒体通信的要求。
-
UDP 支持一对一、一对多、多对一和多对多的交互通信。
-
UDP 的首部开销小,只有 8 个字节。
面向报文的UDP:
-
发送方 UDP 对应用程序交下来的报文,在添加首部后就向下交付 IP 层。UDP 对应用层交下来的报文,既不合并,也不拆分,而是保留这些报文的边界。
-
应用层交给 UDP 多长的报文,UDP 就照样发送,即一次发送一个报文。
-
接收方 UDP 对 IP 层交上来的 UDP 用户数据报,在去除首部后就原封不动地交付上层的应用进程,一次交付一个完整的报文。
-
应用程序必须选择合适大小的报文
![](https://img-blog.csdnimg.cn/img_convert/6581db7947ef4035f3bb8392ff9b6f5b.png)
![](https://img-blog.csdnimg.cn/img_convert/08a673ad878c0dcc5d7f08a1fdbcbf23.png)
![](https://img-blog.csdnimg.cn/img_convert/bf6a88e951722082c8bf167d6080c186.png)
三、传输控制协议 TCP 概述
1.TCP 最主要的特点
![](https://img-blog.csdnimg.cn/img_convert/ac77642118403a6a55ed0cfe38f6f617.png)
注意:
-
TCP 连接是一条虚连接而不是一条真正的物理连接。
-
TCP 对应用进程一次把多长的报文发送到TCP 的缓存中是不关心的。
-
TCP 根据对方给出的窗口值和当前网络拥塞的程度来决定一个报文段应包含多少个字节(UDP 发送的报文长度是应用进程给出的)。
-
TCP 可把太长的数据块划分短一些再传送。TCP 也可等待积累有足够多的字节后再构成报文段发送出去。
2.TCP的连接
TCP 把连接作为最基本的抽象。
-
每一条 TCP 连接有两个端点。
-
TCP 连接的端点不是主机,不是主机的IP 地址,不是应用进程,也不是运输层的协议端口。TCP 连接的端点叫做套接字(socket)或插口。
-
端口号拼接到(contatenated with) IP 地址即构成了套接字。
-
每一条 TCP 连接唯一地被通信两端的两个端点(即两个套接字)所确定
四、可靠传输工作原理
1.停止等待协议
![](https://img-blog.csdnimg.cn/img_convert/e273031c3cfc58320cdf6d25bbea673d.png)
![](https://img-blog.csdnimg.cn/img_convert/13eb40794185396fbf9cc605812e6cf8.png)
-
使用上述的确认和重传机制,我们就可以在不可靠的传输网络上实现可靠的通信。
-
这种可靠传输协议常称为自动重传请求ARQ (Automatic Repeat reQuest)。
-
ARQ 表明重传的请求是自动进行的。接收方不需要请求发送方重传某个出错的分组 。
缺点:
流水线传输:
![](https://img-blog.csdnimg.cn/img_convert/8c1d6d12832675166048aba662a0b520.png)
2.连续ARQ协议
![](https://img-blog.csdnimg.cn/img_convert/6b665b0d97dda2fca399aeeee3ef953f.png)
累积确认:
Go-back-N(回退 N):
-
如果发送方发送了前 5 个分组,而中间的第 3 个分组丢失了。这时接收方只能对前两个分组发出确认。发送方无法知道后面三个分组的下落,而只好把后面的三个分组都再重传一次。
-
这就叫做 Go-back-N(回退 N),表示需要再退回来重传已发送过的 N 个分组。
-
可见当通信线路质量不好时,连续 ARQ 协议会带来负面的影响。
TCP 可靠通信的具体实现:
-
TCP 连接的每一端都必须设有两个窗口——一个发送窗口和一个接收窗口。
-
TCP 的可靠传输机制用字节的序号进行控制。TCP 所有的确认都是基于序号而不是基于报文段。
-
TCP 两端的四个窗口经常处于动态变化之中。
-
TCP连接的往返时间 RTT 也不是固定不变的。需要使用特定的算法估算较为合理的重传时间。
五、TCP报文段的首部格式
![](https://img-blog.csdnimg.cn/img_convert/e18a86157e74a2478ad846501239baf5.png)
-
源端口和目的端口字段——各占 2 字节。端口是运输层与应用层的服务接口。运输层的复用和分用功能都要通过端口才能实现。
-
序号字段——占 4 字节。TCP 连接中传送的数据流中的每一个字节都编上一个序号。序号字段的值则指的是本报文段所发送的数据的第一个字节的序号。
-
确认号字段——占 4 字节,是期望收到对方的下一个报文段的数据的第一个字节的序号。
-
数据偏移(即首部长度)——占 4 位,它指出 TCP 报文段的数据起始处距离 TCP 报文段的起始处有多远。“数据偏移”的单位是 32 位字(以 4 字节为计算单位)。
-
保留字段——占 6 位,保留为今后使用,但目前应置为 0。
-
紧急 URG —— 当 URG 1 时,表明紧急指针字段有效。它告诉系统此报文段中有紧急数据,应尽快传送(相当于高优先级的数据)。
-
确认 ACK —— 只有当 ACK 1 时确认号字段才有效。当 ACK 0 时,确认号无效。
-
推送 PSH (PuSH) —— 接收 TCP 收到 PSH = 1 的报文段,就尽快地交付接收应用进程,而不再等到整个缓存都填满了后再向上交付。
-
复位 RST (ReSeT) —— 当 RST 1 时,表明 TCP 连接中出现严重差错(如由于主机崩溃或其他原因),必须释放连接,然后再重新建立运输连接。
-
同步 SYN —— 同步 SYN = 1 表示这是一个连接请求或连接接受报文。
-
终止 FIN (FINis) —— 用来释放一个连接。FIN 1 表明此报文段的发送端的数据已发送完毕,并要求释放运输连接。
-
窗口字段 —— 占 2 字节,用来让对方设置发送窗口的依据,单位为字节。
-
检验和 —— 占 2 字节。检验和字段检验的范围包括首部和数据这两部分。在计算检验和时,要在 TCP 报文段的前面加上 12 字节的伪首部。
-
紧急指针字段 —— 占 16 位,指出在本报文段中紧急数据共有多少个字节(紧急数据放在本报文段数据的最前面)。
-
选项字段 —— 长度可变。TCP 最初只规定了一种选项,即最大报文段长度 MSS。MSS (Maximum Segment Size)是 TCP 报文段中的数据字段的最大长度。数据字段加上 TCP 首部才等于整个的 TCP 报文段。后面Tcp又增加了其他的选项:
-
窗口扩大选项 ——占 3 字节,其中有一个字节表示移位值 S。新的窗口值等于TCP 首部中的窗口位数增大到(16 + S),相当于把窗口值向左移动 S 位后获得实际的窗口大小。
-
时间戳选项——占10 字节,其中最主要的字段时间戳值字段(4 字节)和时间戳回送回答字段(4 字节)。
-
选择确认选项——在后面的 5.6.3 节介绍。
-
填充字段 —— 这是为了使整个首部长度是 4 字节的整数倍。
六、TCP可靠传输的实现
1.以字节为单位的滑动窗口
![](https://img-blog.csdnimg.cn/img_convert/785aae6c3796fb80a186503d61afb50e.png)
![](https://img-blog.csdnimg.cn/img_convert/60a23b1e92b413fac93f7dcdda6da15c.png)
![](https://img-blog.csdnimg.cn/img_convert/64d418d9733bb1a9449e1887f8d410b9.png)
![](https://img-blog.csdnimg.cn/img_convert/ce66e45aa6dcf11dde378a228e5798b2.png)
发送缓存与接收缓存的作用:
![](https://img-blog.csdnimg.cn/img_convert/ec886b5fe74f52158da672ee9174dff9.png)
-
接收缓存用来暂时存放:
-
按序到达的、但尚未被接收应用程序读取的数据;
-
不按序到达的数据。
![](https://img-blog.csdnimg.cn/img_convert/4c88b6d885d46258c8837cdb3eae774d.png)
需要强调三点:
-
A 的发送窗口并不总是和 B 的接收窗口一样大(因为有一定的时间滞后)。
-
TCP 标准没有规定对不按序到达的数据应如何处理。通常是先临时存放在接收窗口中,等到字节流中所缺少的字节收到后,再按序交付上层的应用进程。
-
TCP 要求接收方必须有累积确认的功能,这样可以减小传输开销。
2.超时重传时间的选择
加权平均往返时间:
-
TCP 保留了 RTT 的一个加权平均往返时间 RTTS(这又称为平滑的往返时间)。
-
第一次测量到 RTT 样本时,RTTS 值就取为所测量到的 RTT 样本值。以后每测量到一个新的 RTT 样本,就按下式重新计算一次 RTTS: 新的 RTTS = (1 -a) * (旧的 RTTS)+ a* (新的 RTT 样本) (5-4)式中,0 < a < 1。若 很接近于零,表示 RTT 值更新较慢。若选择a 接近于 1,则表示 RTT 值更新较快。
-
R- FC 2988 推荐的 a 值为 1/8,即 0.125。
超时重传时间RTO:
-
RTO 应略大于上面得出的加权平均往返时间 RTTS。
-
RTO = RTTS + 4 * RTTD
-
RTTD 是 RTT 的偏差的加权平均值。
-
RFC 2988 建议这样计算 RTTD。第一次测量时,RTTD 值取为测量到的 RTT 样本值的一半。在以后的测量中,则使用下式计算加权平均的 RTTD:
-
新的 RTTD = (1 - b) * (旧的RTTD) + b * |RTTS - 新的 RTT 样本|
-
-
b 是个小于 1 的系数,其推荐值是 1/4,即 0.25。
Karn算法: 在计算平均往返时间 RTT 时,只要报文段重传了,就不采用其往返时间样本。 这样得出的加权平均平均往返时间 RTTS 和超时重传时间 RTO 就较准确。 修正的 Karn 算法:
3.选择确认SACK
七、TCP的流量控制
1.利用滑动窗口实现流量控制
-
一般说来,我们总是希望数据传输得更快一些。但如果发送方把数据发送得过快,接收方就可能来不及接收,这就会造成数据的丢失。
-
流量控制(flow control)就是让发送方的发送速率不要太快,既要让接收方来得及接收,也不要使网络发生拥塞。
-
利用滑动窗口机制可以很方便地在 TCP 连接上实现流量控制。
![](https://img-blog.csdnimg.cn/img_convert/3fe3bf8378af033289a68f5c7b00c52e.png)
持续计时器:
-
TCP 为每一个连接设有一个持续计时器。
-
只要 TCP 连接的一方收到对方的零窗口通知,就启动持续计时器。
-
若持续计时器设置的时间到期,就发送一个零窗口探测报文段(仅携带 1 字节的数据),而对方就在确认这个探测报文段时给出了现在的窗口值。
-
若窗口仍然是零,则收到这个报文段的一方就重新设置持续计时器。
-
若窗口不是零,则死锁的僵局就可以打破了。
2.必须考虑传输效率
可以用不同的机制来控制 TCP 报文段的发送时机:
-
第一种机制是 TCP 维持一个变量,它等于最大报文段长度 MSS。只要缓存中存放的数据达到 MSS 字节时,就组装成一个 TCP 报文段发送出去。
-
第二种机制是由发送方的应用进程指明要求发送报文段,即 TCP 支持的推送(push)操作。
-
第三种机制是发送方的一个计时器期限到了,这时就把当前已有的缓存数据装入报文段(但长度不能超过 MSS)发送出去。
八、TCP的拥塞控制
1.拥塞控制的一般原理
拥塞控制与流量控制的关系:
-
拥塞控制所要做的都有一个前提,就是网络能够承受现有的网络负荷。
-
拥塞控制是一个全局性的过程,涉及到所有的主机、所有的路由器,以及与降低网络传输性能有关的所有因素。
-
流量控制往往指在给定的发送端和接收端之间的点对点通信量的控制。
-
流量控制所要做的就是抑制发送端发送数据的速率,以便使接收端来得及接收。
拥塞控制的一般原理:
-
拥塞控制是很难设计的,因为它是一个动态的(而不是静态的)问题。
-
当前网络正朝着高速化的方向发展,这很容易出现缓存不够大而造成分组的丢失。但分组的丢失是网络发生拥塞的征兆而不是原因。
-
在许多情况下,甚至正是拥塞控制本身成为引起网络性能恶化甚至发生死锁的原因。这点应特别引起重视。
开环控制和闭环控制:
2.几种拥塞控制方法
1.慢开始和拥塞避免
-
发送方维持一个叫做拥塞窗口 cwnd (congestion window)的状态变量。拥塞窗口的大小取决于网络的拥塞程度,并且动态地在变化。发送方让自己的发送窗口等于拥塞窗口。如再考虑到接收方的接收能力,则发送窗口还可能小于拥塞窗口。
-
发送方控制拥塞窗口的原则是:只要网络没有出现拥塞,拥塞窗口就再增大一些,以便把更多的分组发送出去。但只要网络出现拥塞,拥塞窗口就减小一些,以减少注入到网络中的分组数。
慢开始算法的原理:
-
在主机刚刚开始发送报文段时可先设置拥塞窗口 cwnd = 1,即设置为一个最大报文段 MSS 的数值。
-
在每收到一个对新的报文段的确认后,将拥塞窗口加 1,即增加一个 MSS 的数值。
-
用这样的方法逐步增大发送端的拥塞窗口 cwnd,可以使分组注入到网络的速率更加合理。
![](https://img-blog.csdnimg.cn/img_convert/ad32fe9a7c54e805512b1f81002bd1d2.png)
传输轮次:
-
使用慢开始算法后,每经过一个传输轮次,拥塞窗口 cwnd 就加倍。
-
一个传输轮次所经历的时间其实就是往返时间 RTT。
-
“传输轮次”更加强调:把拥塞窗口 cwnd 所允许发送的报文段都连续发送出去,并收到了对已发送的最后一个字节的确认。
-
例如,拥塞窗口 cwnd = 4,这时的往返时间 RTT 就是发送方连续发送 4 个报文段,并收到这 4 个报文段的确认,总共经历的时间。
设置慢开始门限状态变量ssthresh:
-
慢开始门限 ssthresh 的用法如下:
-
当 cwnd < ssthresh 时,使用慢开始算法。
-
当 cwnd > ssthresh 时,停止使用慢开始算法而改用拥塞避免算法。
-
当 cwnd = ssthresh 时,既可使用慢开始算法,也可使用拥塞避免算法。
-
拥塞避免算法的思路是让拥塞窗口 cwnd 缓慢地增大,即每经过一个往返时间 RTT 就把发送方的拥塞窗口 cwnd 加 1,而不是加倍,使拥塞窗口 cwnd 按线性规律缓慢增长。
当网络出现拥塞时:
-
无论在慢开始阶段还是在拥塞避免阶段,只要发送方判断网络出现拥塞(其根据就是没有按时收到确认),就要把慢开始门限 ssthresh 设置为出现拥塞时的发送方窗口值的一半(但不能小于2)。
-
然后把拥塞窗口 cwnd 重新设置为 1,执行慢开始算法。
-
这样做的目的就是要迅速减少主机发送到网络中的分组数,使得发生拥塞的路由器有足够时间把队列中积压的分组处理完毕。
![](https://img-blog.csdnimg.cn/img_convert/12141fa211d3bcddb38e3448f9cda3c1.png)
加法增大: “加法增大”是指执行拥塞避免算法后,在收到对所有报文段的确认后(即经过一个往返时间),就把拥塞窗口 cwnd增加一个 MSS 大小,使拥塞窗口缓慢增大,以防止网络过早出现拥塞。 “拥塞避免”并非指完全能够避免了拥塞。利用以上的措施要完全避免网络拥塞还是不可能的。 “拥塞避免”是说在拥塞避免阶段把拥塞窗口控制为按线性规律增长,使网络比较不容易出现拥塞。 2.快重传和快恢复
-
快重传算法首先要求接收方每收到一个失序的报文段后就立即发出重复确认。这样做可以让发送方及早知道有报文段没有到达接收方。
-
发送方只要一连收到三个重复确认就应当立即重传对方尚未收到的报文段。
-
不难看出,快重传并非取消重传计时器,而是在某些情况下可更早地重传丢失的报文段。
![](https://img-blog.csdnimg.cn/img_convert/e2ca34c6f8b249fd838ac74ecbe4d9b7.png)
快恢复算法 :
![](https://img-blog.csdnimg.cn/img_convert/330802a37978b200572a583a354a9afc.png)
发送窗口的上限值:
-
发送方的发送窗口的上限值应当取为接收方窗口 rwnd 和拥塞窗口 cwnd 这两个变量中较小的一个,即应按以下公式确定: 发送窗口的上限值=Min [rwnd, cwnd] (5-8)
-
当 rwnd < cwnd 时,是接收方的接收能力限制发送窗口的最大值。
-
当 cwnd < rwnd 时,则是网络的拥塞限制发送窗口的最大值。
九、TCP 的运输连接管理
1.运输连接的三个阶段
-
运输连接就有三个阶段,即:连接建立、数据传送和连接释放。运输连接的管理就是使运输连接的建立和释放都能正常地进行。
-
连接建立过程中要解决以下三个问题:
-
要使每一方能够确知对方的存在。
-
要允许双方协商一些参数(如最大报文段长度,最大窗口大小,服务质量等)。
-
能够对运输实体资源(如缓存大小,连接表中的项目等)进行分配。
客户-服务器方式:
![](https://img-blog.csdnimg.cn/img_convert/886c77da14301fb6369ff27e12892382.png)
-
A 的 TCP 向 B 发出连接请求报文段,其首部中的同步位 SYN = 1,并选择序号 seq = x,表明传送数据时的第一个数据字节的序号是 x。
-
B 的 TCP 收到连接请求报文段后,如同意,则发回确认。B 在确认报文段中应使 SYN = 1,使 ACK = 1,其确认号ack = x 1,自己选择的序号 seq = y。
-
A 收到此报文段后向 B 给出确认,其 ACK = 1,确认号 ack = y 1。A 的 TCP 通知上层应用进程,连接已经建立。
-
B 的 TCP 收到主机 A 的确认后,也通知其上层应用进程:TCP 连接已经建立。
2.TCP的释放
![](https://img-blog.csdnimg.cn/img_convert/ddbce959ffd7b56a9f951fd1d9af8804.png)
-
数据传输结束后,通信的双方都可释放连接。现在 A 的应用进程先向其 TCP 发出连接释放报文段,并停止再发送数据,主动关闭 TCP 连接。A 把连接释放报文段首部的 FIN = 1,其序号seq = u,等待 B 的确认。
-
B 发出确认,确认号 ack = u 1,而这个报文段自己的序号 seq = v。TCP 服务器进程通知高层应用进程。从 A 到 B 这个方向的连接就释放了,TCP 连接处于半关闭状态。B 若发送数据,A 仍要接收。
-
若 B 已经没有要向 A 发送的数据,其应用进程就通知 TCP 释放连接。
-
A 收到连接释放报文段后,必须发出确认。
-
在确认报文段中 ACK = 1,确认号 ack w 1,自己的序号 seq = u + 1。TCP 连接必须经过时间 2MSL 后才真正释放掉。
A 必须等待 2MSL 的时间: