Supermind智能网络:全网加速+多地同服是如何炼成的?

网络拥堵甚至中断是互联网业务需要面对的难题。腾讯云基于“IP发布控制+云内骨干网+BGP互联”实现的跨地域网络调度,半年累计已帮助用户屏蔽6960分钟运营商故障。

目前,腾讯云已推出公网流量调度、IP/LB跨地域绑定等能力。11月22日,腾讯云正式推出Supermind智能网络,在国内公有云服务商中率先推出网络传输加速的能力,全面帮助客户优化网络和提升跨地域服务能力,实现体验提升和多地域同服。

那么,这项服务是如何实现的呢?

基本原理——对传输状况恶劣的公网路段进行绕行,就近接收请求

如果客户的流量能走公有云厂商服务节点之间的骨干网来绕开公网拥堵,同时通过控制IP发布对地理距离较远的客户端请求就近接收,用户能得到很大收益:

1) 减少数据包在公网上的传输路径, 避免公网的波动对质量的影响; 2) 公网故障BGP自动切换路由, 在容灾方面天然具有优势; 3) 腾讯骨干网可以提供时延更低,稳定性更高的网络。

基本条件——强大的全球互连互通节点网

网络调度和加速,需要公有云厂商有强大的全球互连互通节点网,和调度控制的能力,才能完成。

腾讯云依托15年的BGP网络运营经验,在面临国内交叉复杂的网络环境中,修炼出一身基于SDN(软件定义网络,Software Defined Network)的跨地域网络调度能力,保障了包括微信、QQ在内的亿万用户良好的互联网通信体验。

具体包括以下几方面:

  • Tb级BGP网络出口,35路运营商聚合 所谓巧妇难为无米之炊,没有BGP出口就不要做公有云。腾讯云在全国各个地域拥有Tb级的BGP网络带宽,聚合35路运营商接入资源,保障了即使用户面对微信春节红包这种Tb级入流量的汹涌攻势,也可以从容应对,绝不抖动。
  • 全球Tb级骨干承载,实现多节点互连互通 没有连接的BGP网络出口,好像战场上被分割的孤岛,无法相互支援。腾讯云Tb级骨干承载网,连通了腾讯云在全球的各大BGP网络出口,实现单地域故障时可以自动进行流量切换。
  • 多维网络监控模型,全局网络监控告警 一方面,腾讯云具备面向全球的网络拨测和自动化告警,从网络层面感知网络运营情况;另一方面,腾讯有大量的自研产品统计上报网络连接质量的统计信息,可以快速定向判断全球网络点对点的网络质量,先于网络层感知网络异常,快速定位问题。
  • IP秒级发布和变更的能力 当IP需要更改发布地域时,整个过程秒级发布,业务不间断。

最终实现——全网调度流程

  • 驾驭全网的SDN控制器: 腾讯云采用SDN转控分离解决解决方案,将复杂的协议与计算诉求放在上层强大的服务器资源中进行,底层设备仅做转发操作。将路径选择、IP发布的算法统一收归到全局唯一的控制器,能推进简化设备的使用,同时利于控制协议与转发设备的快速迭代创新。控制器与腾讯云的全局网络监控连接,具备全网感知能力,快速发现网络异常,下发对应策略。
  • 基于AI的自学习最优路径算法: 传统的BGP选路策略无法适应和支持基于网络通信质量来进行出口优化。SDN控制器的自学习算法,是根据监控反馈的链路质量,通过AI算法计算,以时延和丢包为主要约束条件,支持譬如ISP优先、本地优先、区域优先、AS PATH最短优先等最优出口选择。在几十上百个出口、几万条可选路径的情况下,人工把所有的可能路径遍历研究一遍,可能要几天甚至几个星期来决策。控制器通过神经网络和深度学习来进行处理,在最短时间内计算全局最优的出口,下发路由策略。
  • 多维度、精细化控制: 支持流量本地多出口调度或跨DCI调度。后台可支持主机、网段、区域、AS号、运营商等多维度调度配置。

举个例子

某游戏公司,backend服务集群在广州(不希望搞多套逻辑、数据层,降低成本)。但又希望全国的客户能接入。同时需要全局漂移ip,作为访问的唯一入口。可做全局的就近分配、动态流量分配、故障剔除。 在没有网络跨地域调度能力和就近接入服务的能力,用户只能:

  • 要区分多个外网IP,每个地域都部署集群,维护多个逻辑层,数据层跨地域读写,一致性和实时性很差;
  • 只能寄望运营商链路质量。一旦服务商BGP网络异常,部分地区无法访问。该游戏的用户流失严重;
  • DDOS攻击流量集中在一个IP上,影响巨大;

使用腾讯云的方案后,用户实现了 多点接入,全国同服: 用户只用集中维护一套集群,然后IP/LB以跨地域绑定方式,覆盖全国用户,真正意义的全网同服。后续依靠腾讯云就近接收请求的功能,用户能进一步提高业务全国覆盖能力。用户不用感知网络路径的选择,无需手动指定IP发布的位置。腾讯云在合适的地域进行IP发布来达到质量最优。

入口调度躲拥堵:更改IP的发布地,让流量躲开拥堵地区,实现网络效果优化。出方向同样基于原路返回原则,快速响应client端。

路径冗余:腾讯云Tb级骨干承载网,连通了腾讯云在国内的各大BGP网络出口,各个地域互为POP点在单地域故障时可以实现流量切换。

结语

跨地域流量调度和全网加速的出现,体现了国内IAAS公有云厂商的价值体现从IDC内部向全网覆盖,同时体现了网络管理AI化的趋势。因此supermind智能网络的推出是公有云领域的一个里程碑。

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏网络

容器的优势渗透进基于软件的网络

容器是对IT和网络应用程序开发有重大影响的新技术,容器采用的增加改变了基于软件的网络要求,并为服务提供商提供了通过网络功能虚拟化(NFV)实现其虚拟网络的新选择...

1877
来自专栏SDNLAB

SD-WAN提供安全的云服务接入

谈到云计算,首先想到的是安全问题。因此,对于接入云服务的网络给予了很大的关注。传统的方法是,IT组织依赖于MPLS链路的内在隔离,但是通信服务提供商(CSP)在...

3268
来自专栏云计算D1net

SD-WAN提供安全的云服务接入

谈到云计算,首先想到的是安全问题。因此,对于接入云服务的网络给予了很 大的关注。传统的方法是,IT组织依赖于MPLS链路的内在隔离,但是通信服务提供商(CSP...

3327
来自专栏数据和云

YH10:分布式存储解决方案zData

云和大数据时代的到来导致各行各业数据量的爆发,面对业务数据的日益剧增,企业的IT系统在性能、稳定性和扩展性等方面都面临前所未有的巨大挑战。如何有效应对云和大数据...

3524
来自专栏SDNLAB

数据中心网络性能:新应用下的新需求

随着机器学习,大数据,云计算和NFV不断完善,数据中心网络性能也随之发展。亚马逊,谷歌,百度和腾讯等大型云服务提供商已更新提供IT服务的方式,使之功能更强大,速...

3355
来自专栏鹅厂网事

探秘腾讯网络备件管理演进

"鹅厂网事"由深圳市腾讯计算机系统有限公司技术工程事业群网络平台部运营,我们希望与业界各位志同道合的伙伴交流切磋最新的网络、服务器行业动态信息,同时分享腾讯在网...

2257
来自专栏SDNLAB

EVPN,你真的理解了吗?

EVPN(Ethernet VPN)是很早就提出的一种基于转发面控制信令同步MAC转发表项的草案,最近讨论比较多,这里也对其进行更深层次的解读。 一、什么是E...

3677
来自专栏智能计算时代

区块链101:区块链和数据库的区别是什么?

正如我们的指南中所说的“区块链技术是什么?”传统数据库和区块链之间的区别始于体系结构,或者技术是如何编排的。 在万维网上运行的数据库经常使用客户机-服务器网络体...

3213
来自专栏云计算D1net

如何借助云集群打造高性能计算

云计算一开始致力于为互动系统(systems of engagement)改善应用架构,而在高性能计算方面提供不了什么。而如今,领先的云服务提供商正在重构解决方...

3086
来自专栏SDNLAB

广域网边缘的技术革命

*广域网边缘,即与企业总部数据中心、灾备中心、私有云(VPC)等连接的分支机构的网络及相关联的基础设施。 历经短短数年,手机已经由简单的通讯工具,演变成移动互联...

3849

扫码关注云+社区