TCP/IP之拥塞控制拥塞的成因和代价拥塞控制的方法TCP拥塞控制

拥塞(Congestion) 给一个非正式定义就是:“太多发送主机发送了太多数据或者发送速度太快,以至于网络无法处理” 如果网络中发生了拥塞,会出现如下表现:

  • 分组丢失(路由器缓存溢出)
  • 分组延迟过大(在路由器缓存中排队)

和可靠数据传输一样都是网络领域中的top-10的问题。

拥塞现象是指到达[通信子网]中某一部分的分组数量过多,使得该部分网络来不及处理,以致引起这部分乃至整个网络性能下降的现象,严重时甚至会导致网络通信业务陷入停顿,即出现[死锁]现象。这种现象跟公路网中经常所见的交通拥挤一样,当节假日公路网中车辆大量增加时,各种走向的车流相互干扰,使每辆车到达目的地的时间都相对增加(即延迟增加),甚至有时在某段公路上车辆因堵塞而无法开动(即发生局部[死锁]

我们先讨论一下拥塞的成因和代价

拥塞的成因和代价

我们通过假设不同的场景渐进式分析拥塞的成因和代价

场景一

我们假设

  • 两个senders,两个receivers
  • 一个路由器, 无限缓存
  • 没有重传

image.png

我们假设原始数据的发送速度为in,到达接受方的速度为out,由于路由器的速度限制,即使无限缓存,到达的最大速度也无法超过路由器的速度

image.png

即使发送速度再快,到达速度也无法超过路由器的速度,所以时延在拥塞发生的时候会无限增大。

  • 拥塞时分组延迟太大
  • 达到最大throughput

场景2

我们假设

  • 一个路由器, 有限buffers
  • Sender重传分组

image.png

可以分为一下几种情况讨论

  • 情况a: Sender能够通过某种机制获知路由器buffer信息,有空闲才发

image.png

  • 情况b: 丢失后才重发,显然这样到达速度会减小

image.png

  • 情况c:分组丢失和定时器超时后都重发,显然到达速度进一步减小

image.png

拥塞的代价:

  • 对给定的”goodput”,要做更多的工作 (重传)
  • 造成资源的浪费

场景三

  • 四个发送方
  • 多跳
  • 超时/重传

image.png

随着拥塞的严重,整个网络可能陷入瘫痪,到达速度趋近于0,类似于死锁的状态

image.png

拥塞的另一个代价:

  • 当分组被drop时,任何用于该分组的“上游”传输能力全都被浪费掉,相当于白传了,浪费了资源和传输能力

拥塞控制的方法

端到端拥塞控制:

  • 网络层不需要显式的提供支持
  • 端系统通过观察loss,delay等 网络行为判断是否发生拥塞
  • TCP采取这种方法 *网络辅助的拥塞控制: *路由器向发送方显式地反馈网络 拥塞信息 *简单的拥塞指示(1bit):SNA,DECbit, TCP/IP ECN, ATM) *指示发送方应该采取何种速度

案例:ATM ABR拥塞控制

  • ABR:available bit rate  “弹性服务”  如果发送方路径“underloaded” 使用可用带宽  如果发送方路径拥塞 将发送速率降到最低保障速率
  • RM(resource management)cells  发送方发送  交换机设置RM cell位(网络辅助) • NI bit: rate不许增长 • CI bit: 拥塞指示  RM cell由接收方返回给发送方

TCP拥塞控制

TCP拥塞控制的基本原理

Sender限制发送速率

image.png

CongWin可以动态调整以改变发送速率,并且反映所感知到的网络拥塞。

那么问题来了,如何感知网络拥塞:

  • Loss事件=timeout或3个重复ACK
  • 发生loss事件后,发送方降低速率

感知到网络拥塞后,需要动态调整发送速率,以减轻网络的拥塞状况,如何调整发送速率,一般有两个方法:

  • 加性增—乘性减: AIMD
  • 慢启动: SS

加性增—乘性减: AIMD

顾名思义,这种方法就是先简单的增加,遇到拥塞的情况,就乘性减少。 原理:逐渐增加发送速率,谨慎探测可用带宽,直到发生loss。 Additive Increase: 每个RTT将CongWin增大一个MSS——拥塞避免 Multiplicative Decrease: 发生loss后将CongWin减半。 AIMD方法会使congwin呈锯齿状的波动

image.png

首先慢慢增加,当遇到拥塞时,减为一半,然后又继续慢慢增加,直到遇到拥塞后又减为一半,这样往复就会出现锯齿状的波动。

TCP慢启动: SS

我们考虑下面这种情况: TCP连接建立时, CongWin=1  例:MSS=500 byte, RTT=200msec  初始速率=20k bps 我们发现在这种情况下,可用带宽可能远远高于初始速率,如果我们采用加性增的方法就太慢了,我们希望快速增长到可用带宽。 这就慢启动算法的思想: 当连接开始时,指数性增长。指数性增长。每个RTT将CongWin翻倍。收到每个ACK进行操作。初始速率很慢,但是快速攀升。

image.png

那么问题来了,我们什么时候才进行线性增长来避免拥塞控制? 我们通过设置一个变量 Threshold,Loss事件发生时, Threshold被设为Loss事件前CongWin值的1/2。然后如果cogwin到了Threshold,就开始线性增长。

image.png

如图所示,初始的Threshold变量为8,所以当指数增长大于等于8的时候,就开始线性增长,然后直到发生loss事件,Threshold变为发生loss事件时的一半,也就是6,然后继续指数增长到Threshold,又开始线性增长。

那么我们如何判断loss事件的发生呢? 我们分为两种情况来处理:

  • 3个重复ACKs: CongWin切到一半,然后线性增长
  • Timeout事件: CongWin直接设为1个MSS,然后指数增长,达到threshold后, 再线性增长

我们想想这样做的原因,因为3个重复ACKs表示网络还能够传输一些 segments ,timeout事件表明拥塞更为严重。

慢启动算法:

Th = ?
CongWin = 1 MSS
/* slow start or exponential increase */
While (No Packet Loss and CongWin < Th) {
send CongWin TCP segments
for each ACK increase CongWin by 1
}
/* congestion avoidance or linear increase */
While (No Packet Loss) {
send CongWin TCP segments
for CongWin ACKs, increase CongWin by 1
}
Th = CongWin/2
If (3 Dup ACKs) CongWin = Th;
If (timeout) CongWin=1;

 一个TCP连接总是以1 KB的最大段长发送TCP段,发送方有足够多的数据要发 送。当拥塞窗口为16 KB时发生了超时,如果接下来的4个RTT(往返时间)时 间内的TCP段的传输都是成功的,那么当第4个RTT时间内发送的所有TCP段 都得到肯定应答时,拥塞窗口大小是多少?  解:threshold=16/2=8 KB, CongWin=1 KB, 1个RTT后, CongWin=2 KB ,2 个RTT后, CongWin=4 KB ,3个RTT后, CongWin=8 KB ,Slowstart is over; 4个RTT后, CongWin=9 KB

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器之心

专栏 | 百度深度学习平台PaddlePaddle框架解析

机器之心专栏 来源:百度PaddlePaddle PaddlePaddle 是 2016 年 8 月底百度开源的深度学习平台,并且在短时间内迅速引发全球开发热度...

4045
来自专栏彭湖湾的编程世界

【计算机网络】局域网学习笔记

参考书籍 《计算机网络-自顶向下》       作者 James F. Kurose 《计算机网络技术基础教程》 作者  刘四清, 龚建萍 (教科书) 《图解T...

2259
来自专栏用户画像

3.5.1介质访问控制

介质访问控制所要完成的主要任务是为使用介质的每个结点隔离来自同一信道上其他结点所传送的信号,以协调活动结点的传输。用来决定广播信道中信道分配的协议属于数据链路层...

1023
来自专栏落影的专栏

H.264学习笔记

H.264组成 1、网络提取层 (Network Abstraction Layer,NAL) 2、视讯编码层 (Video Coding Layer,VCL)...

3885
来自专栏小詹同学

知乎大神爬取高颜值美女(Python爬虫+人脸检测+颜值检测)

这是一篇来自知乎大神的技术文章 ---- 写在前面: 本文作者:邓卓 原文链接:本文转发修改已取得原作者授权 https://zhuanlan.zhihu.c...

8637
来自专栏何俊林

FFmpeg总结(一)FFmpeg官方文档分块

正式开启FFmpeg总结,预计这个将是一个2-3年的时间线,或者更久,今天是从官方文档出发,带大家找到最小块的切入点。 http://ffmpeg.org/d...

2997
来自专栏用户画像

1.1.4 计算机网络的分类

广域网的任务是提供长距离通信。运送主机所发送的数据,其覆盖范围通常为几十到几千千米的区域,因而有时也称为远程网。广域网是因特网的核心部分。连续广域网的各结点交换...

674
来自专栏AI科技评论

开发 | 百度开源移动端深度学习框架MDL,可在苹果安卓系统自由切换

AI科技评论消息,日前,百度在 GitHub 上开源了移动端深度学习框架 mobile-deep-learning(MDL)的全部代码以及脚本,这项研究旨在让卷...

28811
来自专栏开源优测

RFC2581 TCP拥塞控制

1204
来自专栏人工智能头条

图解TensorFlow架构与设计

9356

扫码关注云+社区

领取腾讯云代金券