作者简介:黄玉栋,北京邮电大学网络与交换国家重点实验室博一在读,研究方向为网络体系架构,确定性网络,邮箱地址: hyduni@163.com.
当前,确定性网络已成为全球研究热点和迫切需要的重点方向。一方面,在工业互联网的大战略背景下,钢铁、石油、矿井、港口、物流、生产制造等行业与ICT技术深度融合,接入设备海量增长,传统的总线网络逐步被标准化的确定性以太网取代,确定性网络将助力产业向智能化、数字化转型升级,实现提质降本增效。另一方面,新兴的时间敏感的场景与应用,比如车联网、元宇宙、全息通信、远程遥操作、远程诊疗、远程驾驶、远程设备维护、沉浸式实时旅游、交互式远程教育、线上交互演奏音乐会、触觉互联网,激发了人们对未来互联网更大的想象空间,一张带宽、时延、抖动、丢包等服务质量严格有保障的网络,将开启一个全新的互联时代,并带来万亿级的蓝海市场。
以元宇宙应用为例,从技术发展历史来看,互联网正从传递信息的app应用向与生产、生活、健康、娱乐深度融合的元宇宙演进。2010-2020年,伴随着移动互联网、云计算等基础设施的升级,诞生了抖音、微信、淘宝等国民级应用。2020年至今,新一轮产业技术变革开始,Facebook更名为Meta,谷歌Map推出沉浸式实景三维地图,微软收购游戏巨头动视暴雪,字节收购VR创业公司Pico,腾讯发力XR全真互联网,国内外巨头纷纷布局抢占“元宇宙”制高点。此外,对苹果、小米等硬件厂商而言,2022年一季度全球手机出货量下滑11%,3月国内手机市场出货量更是同比下降40.5%,那些能带来全新交互体验的头显、眼镜、耳机、手表、手环、手柄等智能穿戴设备或颠覆手机屏幕,成为新的增长点。
未来十年,网络基础设施能否实现海量“人-机-物”实时互联互操作将是中国能否率先孕育出元宇宙的关键。然而,互联网作为其中的核心环节,目前还不具备确定性的时延、抖动、丢包率等服务质量保障能力,不确定的时延将导致沉浸式体验卡顿、交互晕眩、用户劝退、甚至可能发生安全事故。因此,必须应用未至,网络先行。
网络本身是一个充满不确定性的复杂系统,它包括了终端设备、网络设备、以及计算存储资源;横向看,网络要经过多个自治域,比如局域网、接入网、汇聚网、骨干网、云数据中心;纵向看,网络涵盖了5G、WiFi、光、以太、TCP/IP、Quic、http等从硬件板卡到软件操作系统不同层次的精妙协议技术。互联网发展五十多年里已被千锤百炼,“尽力而为”转发是它的根基,要求它具有确定性反倒有点方枘圆凿,像好看想买的新鞋总是不那么合脚。
为了让传统网络能够平滑演进到确定性网络,更为了方便讨论研究,本文提出可能的三点原则,供大家定义确定性网络。
确定性网络的前提是确定性流量
如果我们能严格的保障应用的服务质量,那一定是因为我们足够了解应用的流量。计算机、手机产生的是用户流量,一般其流量到达曲线可被视为泊松分布,也就是用户使用的时候流量持续发一段时间,不用的时候变得很小,海量流量汇聚的时候曲线变为正态分布,因此具有长尾时延;传统网络对应用不感知,只能尽力地去优化带宽,降低平均时延。而在工业场景,传感器、控制器、执行器产生的是机器流量,他们的流量特征是非常明确的,比如控制指令每1ms发送一个100字节的数据包,占用0.8Mbps的带宽,其到达曲线是没有突发的平均分布。
此外,计算机TCP拥塞控制的慢开始、快重传等特性会带来大量的流量突发,而工业设备(比如PLC)很多没有TCP/IP协议栈,其在二层MAC直接封装成帧就发送出去了。以车载网络为例,其除了影音娱乐外大多数都是机器类的确定性流量,符合这一原则,因此用基于以太网的时间敏感网络技术去替换车内乱如麻的总线,达到降低车身重量、增大车身空间、提升汽车智能化水平是完全可行的。
那如果流量稍微复杂点,不是完全确定的,确定性网络还能行吗?能行。这时我们需要让网络去感知应用,和应用签订SLA服务等级协议,比如承诺最大带宽和突发度,再根据需求沿路径预留带宽、时隙、缓存等网络资源。所以,确定性网络通常也和全局控制、接入控制、建立连接、资源预留、网络演算等技术相关。如果流量不按承诺的来,则超发的流量可能会被丢弃,或者通过各类流量整形的方式使其满足承诺的流量到达模型,当然整形本身也会引入额外的时延。更进一步地,如果是完全任意的流量,那确定性网络则无从谈起。
因此,“确定性”等价于加约束,约束越多,则越确定,“确定性流量”就是“确定性网络”中最大的一个前提约束。
确定性流量只占一小部分
假设我们建了一张确定性的网络,端口速率是100G,那我们能承载100G的确定性流量吗?这几乎是不可能的。而如果确定性流量只占10G,剩下的90G都依然是尽力而为的流量,这就比较能办到。接下来以食堂排队场景和救护车场景分析为什么确定性流最好只占一小部分。
在食堂排队场景中,假设一个公司有1000名员工,他们都在中午12点下班同时去食堂用餐,则排在队伍后面的人必然面临更长的等待时间。由于大家都是平等的,无论调度怎么优化、怎么插队,最后一名“确定性员工”都得不到好的时延抖动保障。网络资源是有限的,网络的确定性和资源的复用性是磁铁的两极。比如拉光纤的专线确定性极高,但其只能点到点传输,没法路由交换和多播,资源复用率低下;以太网采用统计复用,资源利用率高,但当带宽利用率达到30%-50%或更高时,就会产生大量的丢包,又需要硬切片、优先级队列等方式去做隔离,降低资源复用率,从而提高确定性保障。
在救护车场景中,高速公路上有专门的应急车道,同时普通车辆也会主动为救护车让出道路资源,因此救护车得到了优先传输的权利,能在确定的时延内到达目的地。在有许多的救护车的情况下,我们也可以通过调整红绿灯等方式,让救护车之间互相保持距离,在时间和空间上隔离开即可。此外,这也很好的解释了确定性网络不会取代传统互联网,因为它是前向兼容的,传统的尽力而为流量依然可以跑在普通的大马路上。
因此,确定性等价于优先权,而优先权注定了确定性只能占一小部分。
确定性、灵活性、可扩展性
三者只能取二
在早期技术演进中,有ATM和以太网之争,ATM通过建立连接传递信元的类似电路交换的方式是可以严格保证服务质量的,但其没有得到广泛应用。同时,互联网的QoS技术中有DiffServ和IntServ两大模型,其中IntServ通过端到端RSVP资源预留的方式也能为特殊的应用提供确定性服务质量保障,但因为需要维护每流状态导致技术缺少可扩展性,无法应对海量流量的场景,因此也没有得到广泛应用。最终,兼具灵活性和可扩展性的以太网/IP一统天下。
由于以太网具有带宽大、成本低、兼容性好的优点,现在我们想基于以太网实现确定性网络,总要有舍弃。要了确定性,则灵活性和可扩展性是鱼和熊掌不能得兼。比如在局域网范围内,我们通过一些技术可以建一张动态灵活的确定性网络,但一定会受限于网络半径和跳数等因素。如果我们想扩展到大网,想要在复杂拓扑和海量流量场景下实现确定性传输,要了可扩展性,则灵活性一定会大打折扣。而如果一个方案确定性、灵活性、可扩展性三者兼具,那我们很可能需要思考它的技术复杂度和成本昂贵程度是否合适,以及商用落地的可能性。
【活动专栏】
【转载须知】
若转载文章为原创文章,可在相应文章下或公众号后台留言;其他非转载类文章须在文首以不小于14号字体标明转载自SDNLAB。
【投稿】
欢迎SDN、NFV、SD-WAN、智能网卡、确定性网络、TSN、5G 网络切片等网络方向的观点类、新闻类、技术类稿件。
联系人:kk__wu(微信号)
投稿邮箱:pub@sdnlab.com
详情请参考:SDNLAB原创文章奖励计划