首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

数据中心内负载均衡-ECMP的使用分析

ECMP(Equal-cost multi-path) ?...ECMP算法被多种路由协议支持,例如:OSPF、ISIS、EIGRP、BGP等。在数据中心架构VL2中也提到使用ECMP作为负载均衡算法。 对于未开启ECMP的网络来说,无法充分利用路径资源。...ECMP的路径选择策略有多种方法: ◆ 哈希,例如根据源IP地址的哈希为流选择路径。 ◆ 轮询,各个流在多条路径之间轮询传输。...图1.使用ECMP进行负载均衡 ? ECMP面临的问题 ? 然而ECMP是一种较为简单的负载均衡策略,其在实际使用中面临的问题也不容忽视。...以上,为使用ECMP算法进行负载均衡的分析,在数据中心这种突发性流量多,大象流与老鼠流并存的环境中,需要慎重考虑选择的负载均衡策略,ECMP简单易部署但也存在较多问题需要注意。

3.7K60
您找到你想要的搜索结果了吗?
是的
没有找到

基于可编程交换芯片的硬件负载均衡应用

用户可以增加静态ECMP / LAG成员的权重,也可以在ECMP / LAG成员之间进行轮循。...传统上每个流的ECMP选择路径,通常通过5元组或报文头的某种组合来检测流。在现实应用中,流量并非完全相同或相似。有些是老鼠流,有些是大象流。流的流量经常会随时间变化。...通过对Tofino进行P4编程,以检测每个流和数据包延迟。这段只需几十行的P4代码,即可在数据平面中自动完成操作,而不会干扰控制平面。...基于流的ECMP在处理大象流和老鼠流最困难。我们可以考虑特别处理大象流,每当检测到大象流时,都可以将其路由到备用路径,以免干扰其他流量的平衡。 网络中突然增加的流量可能会带来麻烦。...可以考虑增加一段P4程序,在数据面自动检测ECMP所有路径的带宽占用情况,在流量很高时动态添加新路径,或在流量很低时动态删除路径。以监视ECMP路径的速率和流速。

1.7K10

一个简化的可横向扩容的高可用的四层接入网关的原理说明——ECMP

使用的技术包括ECMP和LVS(ipvs ipvsadm)。...ECMP(Equal Cost Multi Path)用作L3(三层)负载均衡,用于解决“负载均衡服务器”的单点和扩缩容的问题。支持ECMP特性的路由器将IP报文转发到不同的“负载均衡服务器”上。...本文就ECMP做详细的说明,并搭建图1中的“ECMP部分”。 LVS用作L4(四层)负载均衡,用于解决单台“真实服务器”扩缩容麻烦和性能瓶颈的问题。...ECMP本是路由器的技术,那在搭建这个简化的“接入网关”我们配置好路由ECMP就好了,还需要做什么呢?...比如说:L2的BFD协议能在毫秒级别内检测链路异常,能够快速地踢掉出现链路故障的或宕机的“负载均衡服务器”;L3/L4的内部网关/路由协议快速地扩缩容或者踢掉出现故障的“负载均衡服务器”。

4.4K50

技术分析:对比交换机堆叠技术,园区的“云化集群”是否可行?

运行堆叠技术会给交换机软件增加很多复杂性(例如堆叠组管理、分裂检测等)。在现实中,堆叠组内的多台设备高度关联,一损俱损,软件问题甚至可以导致整个堆叠组的瘫痪。五、物理拓扑结构受限。...32位主机路由、BGP同步等功能,利用L3网络天然的高可靠、多路径能力,达到跟传统堆叠一样的效果;不涉及复杂的堆叠软件开发,因此系统的稳定性非常高,不会因为复杂的堆叠逻辑引入潜在的Bug;利用L3网络的ECMP...Spine层和Leaf层之间使用通用线缆连接2.增强配置(分裂检测,负载均衡模式)2.配置本机接口和peer信息高可用性 物理设备之间的链路聚合全三层网络,天然避免广播风暴和以太环路;运行BGP和ECMP...图片对比点3:“运行生成树协议阻塞线路” vs “网络天然无环+ECMP路由分担负载”传统的园区网络为提高组网的可靠性并避免以太网环路和广播风暴等问题,部署了很多复杂的功能(如堆叠、MC-LAG、STP...星融元的云化园区网络方案采用天然无环路的Spine-Leaf架构,全三层路由组网,全网链路基于ECMP多路径负载分担,在保证高链路利用率和低复杂度的前提下实现了组网的可靠性。

65520

大规模(万卡)集群训练平台设计方案 MegaScale: Scaling Large Language Model Training 视频教程

PFC DCQCN NCCL通信超时重传_哔哩哔哩_bilibili1.9 底层算子融合为什么能加速计算_哔哩哔哩_bilibili1.10 万卡集群集群容错性能监控 心跳检测 自行诊断 故障恢复_哔哩哔哩...添加图片注释,不超过 140 字(可选)添加图片注释,不超过 140 字(可选)4.5.2 减少 ECMP 哈希冲突ECMP(Equal-Cost Multi-Path routing)等价多路径负载均衡...就是比如现在有两条路径都可以到达,ECMP根据IP、端口号等计算一个哈希值(这个我们NCCL源码解读1里面有讲到)。通过计算哈希值,确定走哪条路径。...如何减少ECMP 哈希冲突,这玩意真不了解,后面有时间再调研调研。4.5.3 拥塞控制IB(Infiniband)不是贼贵么,而且还是私有协议,但确定快。...4.5 集群容错1.10 万卡集群集群容错性能监控 心跳检测 自行诊断 故障恢复_哔哩哔哩_bilibili添加图片注释,不超过 140 字(可选)4.5.1 心跳检测心跳消息监测异常,发现异常发出早期警告

9110

人脸检测——笑脸检测

前边已经详细介绍过人脸检测,其实检测类都可以归属于同一类,毕竟换汤不换药!...无论是人脸检测还是笑脸检测,又或者是opencv3以后版本加入的猫脸检测都是一个原理,用的是detectMultiScale函数,其具体使用参考公众号历史文章中的人脸检测(一)——基于单文档的应用台程序即可...~ 笑脸检测用的还是那个函数(还是熟悉的味道!)...这里主要分两步来说: 1.加载人脸检测器进行人脸检测 2 加载笑脸检测器进行笑脸检测 其具体程序如下,可以实现对图片的检测,也可以调用摄像头对采集到的实时图像进行检测,需要完整项目的后台回复关键词...“笑脸检测”即可~ 关键部分程序如下: ?

2.9K70

能ping通,TCP就一定能连通吗?

可以看到,中间某几行,有好几个IP,也就是说这一跳里同时可以选好几个目的机器,说明这段路径支持ECMPECMP有什么用 利用等价多路径,我们可以增加链路带宽。 举个例子。...ECMP的路径选择策略 当初开启ECMP就是为了提升性能,现在反而加重了乱序,降低了TCP传输性能。 这怎么能忍。 为了解决这个问题,我们需要有一个合理的路径选择策略。...如果路由开启了ECMP,那就可以同时利用这几条路径做传输。 ECMP可以提高链路带宽,同时利用五元组做哈希键进行路径选择,保证了同一条连接的数据包走同一条路径,减少了乱序的情况。...可以通过traceroute命令查看到链路上是否有用到ECMP的情况。...开启了ECMP的网络链路中,TCP和ping命令可能走的路径不同,甚至同样是TCP,不同连接之间,走的路径也不同,因此出现了连接时好时坏的问题,实在是走投无路了,可以考虑下是不是跟ECMP有关。

1.6K10

【目标检测】SSD目标检测

场景文字识别 目标检测任务的目标是给定一张图像或是视频帧,让计算机找出其中所有目标的位置,并给出每个目标的具体类别。对于人类来说,目标检测是一个非常简单的任务。...【目标检测】 SSD目标检测 |1....概述 SSD全称:Single Shot MultiBox Detector,是目标检测领域较新且效果较好的检测算法之一[1],有着检测速度快且检测精度高的特点。...SSD原理 SSD使用一个卷积神经网络实现“端到端”的检测:输入为原始图像,输出为检测结果,无需借助外部工具或流程进行特征提取、候选框生成等。...共包含4个字段,以tab分割,第一个字段是检测图像路径,第二字段为检测矩形框内类别,第三个字段是置信度,第四个字段是4个坐标值(以空格分割)。

4.3K90

可视化网络路径探测HashTrace

挑战 作为内行,大家也都造现在的网络设计讲究双节点冗余保护——几乎每一过一个hop都有2台或2个以上的冗余节点,在路由上形成非常复杂的ECMP(假设端到端路径中有n个hop均是2台节点,那么端到端...ECMP一共有2^n个),传统的ping和traceroute在这种场景中有几个缺陷: l ping和traceroute的执行是命令行方式,返回结果也是命令行环境的字符串形式,解读起来不够直观,特别是...traceroute需要一定的网络功底; l 网络设备在ECMP转发时,由于不同链路转发延时的区别,如果对于一个会话的数据包在所有ECMP路径上轮询转发,会导致jitter,网络体验会非常差,所以网络设备会将每个会话的所有数据包都发往其中一条路径...或者MPLS TE隧道,traceroute无法反馈L2 ECMP结果和MPLS TE隧道信息,这些信息我们称为物理路径。...对策和方案 为了探测所有可能的ECMP,Paris Trace出现了,它可以发现并探测端到端的ECMP各个冗余节点。

2.8K80

超级流量负载方案ospf+lvs

本文简单介绍一下,如何基于ECMP,使用Quagga+LVS+Keepalived构建多活负载均衡方案 1. 背景介绍 负载均衡,主要用于大规模分布式集群下,提供高性能服务。...OSPF会通过多播的方式自动对外传播检测到的网络变化。 RIP,即路由信息协议,是一个老的协议。RIP路由器向网络中周期性多播它的整个路由表,而不像ospf只多播网络的变化。...ECMP:等价多路径协议。即当存在多条不同的链路到达同一目的地址时,利用ECMP可以同时使用多条链路,不仅增加了传输带宽,还可以无时延、无丢包的备份失效链路的数据传输。...keepalived只使用期后端服务检测功能。 在keepalived-LVS集群的抢占模式下,master节点的网卡挂在VIP,此时VIP的设备是唯一的。...表示客户端IP所在的整个网段的请求都会分配给同一台RS protocol TCP # 使用协议,TCP|UDP|SCTP inhibit_on_failure on #配置该项,在检测到后端

2.7K10

透过MH370看网络自动化监控

所有匹配同一条路由的数据包在转发平面被不同的因子(如5元组、3元组、2元组等)定义成不同的流,不同的流通过hash算法映射到这条路由不同ECMP上,由于流的定义和流量大小没有关系,因此实际的ECMP链路利用率并不是规划中的流量负载均衡...,而是流数量负载均衡; l ECMP目前的监控也是比较薄弱的,有可能出现这种情况传统的网管是不会告警的,ECMP路由正常,但转发流量却一边是100%另外一边是0%,智能的网管应该产生告警,让我们检查一下是否...hash的因子没有配置正确或者设备出现了故障; l 在路由层面的ECMP确定好outputinterface正好是一个LACP聚合组,在流量在LACP聚合组内形成L2ECMP,这时候同样采用hash进行流数目负载均衡...ECMP有L3和L2两个层面,比如Leaf1上就是2条L3 ECMP路由 1. 每条activeroute都对应一个output-if; 2....在Spine1的情况会复杂一些,因为这是一个L2/L3混合ECMP场景: 1. L2ECMP首先要检查所有成员链路状态是否是selected; 2.

87190

当网络传输协议SRD遇上DPU

SRD的特点: 1)不保留数据包顺序,交给上层消息传递层处理 2)通过尽可能多的网络路径发包,利用ECMP标准,发端控制数据包封装来控制ECMP路径选择,实现多路径的负载平衡 3)自有拥塞控制算法,基于每个连接动态速率限制...,结合RTT(Round Trip Time)飞行时间来检测拥塞,可快速从丢包或链路故障中恢复 4)由于无序发包以及不支持分段,SRD传输时所需要的QP(队列对)显著减少 Why?...此外,即使使用 PFC,RoCE 在拥塞(类似于 TCP)和次优拥塞控制下仍会遭受 ECMP(等价多路径路由)冲突。 >为什么是SRD? SRD是专为AWS设计的可靠的、高性能的、低延迟的网络传输。...SRD的主要功能包括: 1)乱序交付:取消按顺序传递消息的约束,消除了队头阻塞,AWS在EFA用户空间软件堆栈中实现了数据包重排序处理引擎 2)等价多路径路由(ECMP):两个EFA实例之间可能有数百条路径

1.9K30

就绪检测&存活检测---实验

检查探针---就绪检测 readinessProbe-httpget 创建资源清单 [root@k8s-master ~]# vim read.yaml apiVersion: v1 kind: Pod...Running 0 2m36s yzapp-pod 1/1 Running 19 19h 检查探针---三种存活检测...periodSeconds: 3 意思就是容器创建后会创建一个文件 /tmp/live,然后休眠60秒,然后删除这个文件,然后再休眠6分钟 在创建容器后的一分钟内文件是存在的,然后一分钟后文件删除了,我们检测不到了这个文件...5 timeoutSeconds: 1 tcpSocket: port: 8080 periodSeconds: 3 5秒以后开始检测...,检测时候发起连接我们的8080端口,但是端口肯定是不通的,然后一秒以后自己知道是失败了,然后重启Pod 创建Pod资源 [root@k8s-master ~]# kubectl create -f liveness-tcp.yaml

73920

【8点20】深入了解Facebook 的Altoona数据中心网络

该架构方案与设备商无关,仅仅利用BGP和Equal Cost Multi-Path (ECMP) 路由协议实现简单的拓扑,并且以主干-分支的网络结构实现各层独立拓展的功能。...你刚刚说除了ECMP,BGP是Altoona数据中心使用的唯一路由协议,那么这个例子是不是你们保持网络简单性的一个证明? Andreyev:是的,而且我们使用最少的一组功能操作拓扑。...我们设计路由的宗旨就是绝大多数流,包括BGP和ECMP可以工作的很好。但是如果我们需要一个与BGP决策无关的自定义路由,可以使用控制器功能逐跳部署,并且我们可以快速实现部署。...Andreyev:是的,当我们检测到问题,系统就会查看问题,确认是已知问题,然后修正问题并通知操作者。因为我们采用自动发现机制,所以修正后可能再次发现新问题。...大体而言这个框架就是检测问题,然后采取相应的动作解决问题,确认动作的正确性并报告问题。 事实上我们推崇的并不只是这个工具,而是这种理念,通过各种途径了解问题,简化操作。

1K50

cvpr目标检测_目标检测指标

特征金字塔(Feature pyramids)是识别系统中用于检测不同尺度目标的基本组件。但是最近的深度学习目标检测器已经避免了金字塔表示,部分原因是它们是计算和内存密集型的。...(b) 最近的检测系统选择仅使用单尺度特征来加快检测速度。 © 另一种方法是重用由 ConvNet 计算的金字塔特征层次结构,就好像它是一个特征化的图像金字塔一样。...在 HOG 和 SIFT 之前,使用 ConvNets [38, 32] 进行人脸检测的早期工作计算了图像金字塔上的浅层网络,以跨尺度检测人脸。 深度卷积网络目标检测器。...OverFeat 采用了类似于早期神经网络人脸检测器的策略,将 ConvNet 用作图像金字塔上的滑动窗口检测器。...然而,多尺度检测仍然表现更好,尤其是对于小物体。 使用多层的方法。最近的一些方法通过在 ConvNet 中使用不同的层来改进检测和分割。

82440

基于 Mtcnn(人脸检测)+Hopenet(姿态检测)+Laplacian(模糊度检测) 的人脸检测服务

写在前面 工作原因,顺便整理 博文内容为一个 人脸检测服务分享 以打包 Docker 镜像,可以直接使用 服务目前仅支持 http 方式 该检测器主要适用低质量人脸图片识别 理解不足小伙伴帮忙指正,多交流...最终,O-Net提供了最终的人脸检测结果和人脸关键点的位置信息。 影响因子(原始图像的比例跨度)(scale_factor): MTCNN 使用了图像金字塔来检测不同尺度的人脸。...通过对图像进行 缩放,可以检测到不同大小的人脸。影响因子是指图像金字塔中的 缩放因子,控制了不同尺度之间的跨度。较小的影响因子会导致 更多的金字塔层级,可以检测到 更小的人脸,但会增加计算时间。...较大的影响因子可以 加快检测速度,但可能会错过 较小的人脸。因此,选择合适的影响因子是在准确度和速度之间进行权衡的关键。...较小的最小面容参数可以检测到更小的人脸,但可能会增加 虚警(错误接受)的机会。较大的最小面容参数可以 减少虚警,但可能会漏检一些较小的人脸。

23520

OpenCV检测篇(二):笑脸检测

前言 由于本文与上一篇OpenCV检测篇(一):猫脸检测具有知识上的连贯性,所以建议没读过前一篇的先去阅读一下前一篇,前面讲过的内容这里会省略掉。...笑脸检测 其实也没什么可省略的,因为跟在opencv中,无论是人脸检测、人眼检测、猫脸检测、行人检测等等,套路都是一样的。正所谓: 自古深情留不住,总是套路得人心。...前一篇猫脸检测中已经提到过这个函数,这里就不再详细赘述。...这里只说一下笑脸检测的流程,显然也都是套路: 1.加载人脸检测器进行人脸检测 2 加载笑脸检测器进行笑脸检测 检测的时候用的都是同一个函数,也即上述detectMultiScale()函数。...这里需要注意的一点是: 笑脸检测是在人脸检测之后得到的人脸区域中进行的。我猜它用到的算法很可能是检测人的嘴角的姿态,因为笑脸检测最后的输出结果就是框住了人上扬的嘴角。

3.2K10
领券