北京数据中心网络运维自动化及监控智能化工作取得显著成果

2017年北京数据中心网络通讯处依托云管理平台优化项目和智能化监控项目,成立自动化小组,根据中心智能化运维工作目标要求,加快推动运维自动化和智能监控水平。

01

变更自动化比例超出预期

变更占据了网络处日常运维最大的工作量。2017年以前,标准变更自动化主要应用于防火墙产品。2017年,网络处基于Groovy/Expect编程实现了网络各类产品自动化变更的全面推广,防火墙标准变更自动化覆盖率接近100%,负载均衡、DNS超过80%、交换机约90%、路由器约50%、PBX达到80%。整体标准变更自动化比例超出了70%的预定目标。

02

监控智能化提升应急效率

除了网管监控工具和流量分析工具,过去网络缺少快速检查的应急辅助手段。以常见的根据服务器ip查找对应交换机接入端口场景为例,以往要靠人工逐级登陆汇聚、汇接、接入设备才能找出对应关系。现在通过Python工具开发建立了设备配置/状态解析和服务器关联,实现了在云平台输入服务器ip即可查找到对应的网络接入链路和端口。此外通过集中监控应用拓扑图功能,也能够快速展现服务器部署单元和网络接入的层次对应关系。这些功能的实现有效提高了网络应急检查效率。

03

告警优化减少日常重复工作

以告警压制为例,广域网线路闪断恢复告警压制功能的实现,使得广域网线路中断告警日均减少约50%,极大提升了告警有效性及处理效率。

04

人员培养奠定网络转型基础

网络处组织自动化小组成员学习Kibana/Grafana工具,制作设备性能状态图表,使用Groovy/Expect编写变更自动化脚本,熟练运用Python语言进行设备配置和状态项结构化编程解析,为未来网络运维人员的软件化转型打下了技术基础。

2017年网络运维自动化及监控智能化工作的成果,显著提升了北数网络日常运维及应急处置的工作效率,为日后网络自动化、智能化、软件化的推进迈开了重要的一步。

本期供稿:网络通讯处

部分图片摘自网络

北数纵横

请留下你指尖的温度

让太阳拥抱你

这是一个有温度的公众号

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180105F0HWUE00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券