Supermind智能网络:全网加速+多地同服是如何炼成的?

网络拥堵甚至中断是互联网业务需要面对的难题。腾讯云基于“IP发布控制+云内骨干网+BGP互联”实现的跨地域网络调度,半年累计已帮助用户屏蔽6960分钟运营商故障。

目前,腾讯云已推出公网流量调度、IP/LB跨地域绑定等能力。11月22日,腾讯云正式推出Supermind智能网络,在国内公有云服务商中率先推出网络传输加速的能力,全面帮助客户优化网络和提升跨地域服务能力,实现体验提升和多地域同服。

那么,这项服务是如何实现的呢?

基本原理——对传输状况恶劣的公网路段进行绕行,就近接收请求

如果客户的流量能走公有云厂商服务节点之间的骨干网来绕开公网拥堵,同时通过控制IP发布对地理距离较远的客户端请求就近接收,用户能得到很大收益:

1) 减少数据包在公网上的传输路径, 避免公网的波动对质量的影响; 2) 公网故障BGP自动切换路由, 在容灾方面天然具有优势; 3) 腾讯骨干网可以提供时延更低,稳定性更高的网络。

基本条件——强大的全球互连互通节点网

网络调度和加速,需要公有云厂商有强大的全球互连互通节点网,和调度控制的能力,才能完成。

腾讯云依托15年的BGP网络运营经验,在面临国内交叉复杂的网络环境中,修炼出一身基于SDN(软件定义网络,Software Defined Network)的跨地域网络调度能力,保障了包括微信、QQ在内的亿万用户良好的互联网通信体验。

具体包括以下几方面:

  • Tb级BGP网络出口,35路运营商聚合 所谓巧妇难为无米之炊,没有BGP出口就不要做公有云。腾讯云在全国各个地域拥有Tb级的BGP网络带宽,聚合35路运营商接入资源,保障了即使用户面对微信春节红包这种Tb级入流量的汹涌攻势,也可以从容应对,绝不抖动。
  • 全球Tb级骨干承载,实现多节点互连互通 没有连接的BGP网络出口,好像战场上被分割的孤岛,无法相互支援。腾讯云Tb级骨干承载网,连通了腾讯云在全球的各大BGP网络出口,实现单地域故障时可以自动进行流量切换。
  • 多维网络监控模型,全局网络监控告警 一方面,腾讯云具备面向全球的网络拨测和自动化告警,从网络层面感知网络运营情况;另一方面,腾讯有大量的自研产品统计上报网络连接质量的统计信息,可以快速定向判断全球网络点对点的网络质量,先于网络层感知网络异常,快速定位问题。
  • IP秒级发布和变更的能力 当IP需要更改发布地域时,整个过程秒级发布,业务不间断。

最终实现——全网调度流程

  • 驾驭全网的SDN控制器: 腾讯云采用SDN转控分离解决解决方案,将复杂的协议与计算诉求放在上层强大的服务器资源中进行,底层设备仅做转发操作。将路径选择、IP发布的算法统一收归到全局唯一的控制器,能推进简化设备的使用,同时利于控制协议与转发设备的快速迭代创新。控制器与腾讯云的全局网络监控连接,具备全网感知能力,快速发现网络异常,下发对应策略。
  • 基于AI的自学习最优路径算法: 传统的BGP选路策略无法适应和支持基于网络通信质量来进行出口优化。SDN控制器的自学习算法,是根据监控反馈的链路质量,通过AI算法计算,以时延和丢包为主要约束条件,支持譬如ISP优先、本地优先、区域优先、AS PATH最短优先等最优出口选择。在几十上百个出口、几万条可选路径的情况下,人工把所有的可能路径遍历研究一遍,可能要几天甚至几个星期来决策。控制器通过神经网络和深度学习来进行处理,在最短时间内计算全局最优的出口,下发路由策略。
  • 多维度、精细化控制: 支持流量本地多出口调度或跨DCI调度。后台可支持主机、网段、区域、AS号、运营商等多维度调度配置。

举个例子

某游戏公司,backend服务集群在广州(不希望搞多套逻辑、数据层,降低成本)。但又希望全国的客户能接入。同时需要全局漂移ip,作为访问的唯一入口。可做全局的就近分配、动态流量分配、故障剔除。 在没有网络跨地域调度能力和就近接入服务的能力,用户只能:

  • 要区分多个外网IP,每个地域都部署集群,维护多个逻辑层,数据层跨地域读写,一致性和实时性很差;
  • 只能寄望运营商链路质量。一旦服务商BGP网络异常,部分地区无法访问。该游戏的用户流失严重;
  • DDOS攻击流量集中在一个IP上,影响巨大;

使用腾讯云的方案后,用户实现了 多点接入,全国同服: 用户只用集中维护一套集群,然后IP/LB以跨地域绑定方式,覆盖全国用户,真正意义的全网同服。后续依靠腾讯云就近接收请求的功能,用户能进一步提高业务全国覆盖能力。用户不用感知网络路径的选择,无需手动指定IP发布的位置。腾讯云在合适的地域进行IP发布来达到质量最优。

入口调度躲拥堵:更改IP的发布地,让流量躲开拥堵地区,实现网络效果优化。出方向同样基于原路返回原则,快速响应client端。

路径冗余:腾讯云Tb级骨干承载网,连通了腾讯云在国内的各大BGP网络出口,各个地域互为POP点在单地域故障时可以实现流量切换。

结语

跨地域流量调度和全网加速的出现,体现了国内IAAS公有云厂商的价值体现从IDC内部向全网覆盖,同时体现了网络管理AI化的趋势。因此supermind智能网络的推出是公有云领域的一个里程碑。

原创声明,本文系作者授权云+社区-专栏发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏视频咖

衡量直播平台的推流效果,主要看这5个指标

近年来,网络直播呈现爆发式增长,上百家平台,超百亿规模,3亿多用户,上市公司和明星企业崛起,俨然成为产业。光环加持的背后,腾讯云直播TLive平台,抓住机遇、持...

942
来自专栏SAP最佳业务实践

ERP物流中的物料状态

即使是在理想的状态下,物流在工厂内部也很难形成单向的流动。退货、外协、返工等等给物流的管理增加了难度,该用什么参数来描述才能真实反映物流的真实情况呢?   ...

1.1K12
来自专栏机器人网

西门子全新“资产分析服务”为工厂提供在线状态监测

西门子日前推出了一项全新的“资产分析服务”项目,旨在为机器设备、生产线乃至整个工厂提供在线状态监测。作为服务内容的一部分,西门子专家将协助客户对运行数据和状态数...

3246
来自专栏大数据文摘

对话蚂蚁金服 | TechFin趋势下如何应对超大规模实时分布式关系网络

2523
来自专栏云传输

案例分享|足球频道实现全媒体素材高效传输,为球迷带来视听盛宴

2014年9月4日国务院第七次足球工作座谈会确定内蒙古为全国足球改革与发展工作唯一试点省区。9月15日下午,内蒙古自治区政府召开推进足球改革发展电视电话会议,自...

1384
来自专栏人人都是极客

如何搭建一个物联网系统框架?

只有设备接入到网络里面,才能算是物联网设备。这里涉及到2个关键点:接入方式以及网络通信方式。

723
来自专栏金融民工小曾

为什么我们都成了低头族?

低头族,是指我们这些无论何时何地都作“低头看屏幕”状,想通过盯住屏幕的方式,把零碎的时间填满的人。

522
来自专栏区块链资讯

BCH升级辩论仍在继续:BU提出一项新的硬分叉策略

8月21日Bitcoin Unlimited(比特币无限)首席开发者安德鲁·斯通(Andrew Stone)撰写了一份提案,提出一项11月BCH硬分叉的策略。斯...

623
来自专栏安智客

ARM安全平台白皮书解读

为什么要推出PSA? 谁解决了物联网互联设备的信任和安全问题,谁就可以在物联网阶段取得成功!ARM公司针对各种安全威胁,平衡成本和安全需求之间的矛盾,从移动端A...

1865

工业物联网需要边缘的五个原因

随着我们生活和工作的空间开始变得对网络有所了解并对其环境中发生的事件做出反应,工业物联网正迅速成为事实。在这些空间中,不同复杂度的“事物”包括测量温度值的传感器...

3139

扫码关注云+社区