故障中的诺亚方舟——之抗打击篇

“故障中的诺亚方舟”主要是体现全面提高网络抗灾害的能力,特别是提升极端情况、低级错误下、多灾并发时的抗打击能力。提高故障中避免形成客户影响的回旋余地,精细化变更管理,增强应急容灾实力,任凭泰山崩于前,做到紧急故障处理中的气定神闲,即便是多灾多难,仍能在客户感知上达成修成正果。网管中心要在夯实基础上做文章,在破解难点上求突破,在小题大做中写总结,确保网络在历经“洪水灾难”时,仍能有惊无险,安全平稳地运行。

“诺亚方舟”做到极致,一方面是做好网络“养生”,消除隐患,避免灾难事件的发生;另一方面是提高网络“抗打击能力”,任何故障面前总有“方舟”级的机制或设备“挺身而出”,接管起网络运行任务。

---抗打击一:

优化EPC DNS组网结构,提升4G业务容灾能力

通过EPC DNS的一级组网构架改造,实现省内EPC网络一级DNS异局址容灾,在沈阳和大连实现跨区域容灾备份能力,进一步夯实我省4G、VoLTE业务容灾能力。

实施效果:SYDNS03/04互为热备份,当其中任何一个DNS发生故障时,业务自动由另一个DNS承载,业务未受影响;当SYDNS03/04设备同时发生故障,业务自动由跨区域容灾备份的DLDNS05/06承载。同样,大连两个DNS设备业务容灾同沈阳两个DNS的容灾机制,从而保障了当设备故障时业务未受影响

---抗打击二:

实现集客专线4G抢通能力,确保光缆故障快速恢复

针对集客专线光缆故障不能短时间内恢复的问题,为了不耽误客户使用,通过两台4G无线路由器替代故障光缆,临时恢复客户业务。

实施效果:当客户侧传输设备与基站侧传输设备间发生光缆阻断时,利用两台4G无线路由器替代故障光缆,实现重要集客专线光缆故障的快速抢通能力,业务恢复正常使用

---抗打击三:

业务管理平台核心组件容灾,确保认证鉴权开户等顺畅

通过业务放通、两级分组容灾、主备容灾三种方式实现OTT业务管理平台的容灾,对于内容注入、开销户、认证等具备自动切换能力,有效提升了业务管理平台的可靠性和容灾能力。

实施效果:OTT业务管理平台包括不同业务模块,各业务模块采用多种容灾备份方案。当调度和查询组件出现故障时,将其从业务流程中排除,业务未受影响;当认证组件出现故障时,通过在地市分组内建立的集群实现容灾,分组之间和中心节点实现多级灾备,业务未受影响;当主用数据库出现故障时,备用数据库承载业务,实现主备容灾,业务仍未受影响

---抗打击四:

OTT实现跨域及域内容灾,确保魔百盒客户观影体验

实现沈阳与大连域间的容灾能力,确保两个业务域中任何一个出现问题,另一个均能顺利接管。同时实现域内所带城市的容灾能力,确保域内任一城市业务受损均可顺利实现容灾。

实施效果:沈大域实现域间备份,当任何一个域发生整体故障,可向另一个备份域进行切换,实现该域内魔百和业务的整体迁移,业务未受影响;域内各地市节点实现域内备份,当某地市的边缘节点故障,该市魔百和业务将切换到备份地市边缘节点上,业务仍未受影响

---抗打击五:

传输自下而上三层保护,保障全网业务快速

1

一重:OLP保护

干线传输系统已部署了OLP主备光缆保护。在主用光缆中断时,OLP系统将业务切换至备用光缆进行承载,保障传输系统正常运行。

2

二重:环网及业务保护

业务的主用及备用光缆全部中断,一重 OLP保护失效,传输系统或者配置负载分担的业务会自动进行路由切换,保障传输电路对业务的正常承载。

3

三重:应急保护

在二重保护失效后,业务中断无法自动恢复。此时传输可手工使用预留空闲传输资源进行应急配置,使业务切换至应急路由上以达到快速恢复的目的,保证业务使用。

实施效果:2017年7月,辽中至盘锦方向主用光缆中断,传输自动启用一重OLP保护,业务未受影响。随后同段落备用光缆中断,传输自动启用二重环网及业务保护,大部分业务受到保护覆盖未受影响。CMNET电路未配置环网保护,无法自动恢复,启用业务侧负载分担保护,业务数据均切换至另一侧。但此时4G、家客业务迅猛发展,CMNET电路扩容在即,业务数据切换后利用率瞬间暴增越限。传输收到该情况通知后,迅速启动三重应急保护,相关负责人对中断电路进行环网保护配置,业务得到恢复

---抗打击六:

低压系统间内部互联,提升供电保障能力

低压配电系统内、外部多重保护,确保供电系统安全稳定运行。

实施效果:当市电1发生故障,市电2将自动为低压配电系统供电,业务未受影响;当市电2发生故障,市电1将自动为低压配电系统供电,业务未受影响;当市电1、市电2发生故障,油机将为低压配电系统供电,业务未受影响;当1#低压配电系统发生故障,2#低压配电系统将自动承担1#低压配电系统的供电能力,业务仍未受到影响

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180408F128O300?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券