-1-
产品概述
苏研大云运维管理平台(BC-DeepWatch)是基于Sensu、Ansible、Graphite等开源技术自主研究开发的运维产品。BC-DeepWatch集云主机性能监控、物理设备告警采集、多种服务组件日志抽取分析、主机配置自动化运维等多种能力,为用户全面了解云上的资源使用情况、业务的运行状况提供保障。
-2-
发展回顾
-3-
产品优势
-4-
功能架构
此次发布的BC-DeepWatch V1.2.0 主要在告警对接范围、性能指标丰富性、自动化运维能力提高几个方面做出突破。
BC-DeepWatch核心功能点如下:
-5-
功能特性
日志管理
平台日志采集使用当前流行的开源框架ELK,依此,BC-DeepWatch平台的日志管理能够实现实时搜索、运行稳定、数据可靠、展示快速的效果 。
DeepWatch产品在设计之初便将对接多个平台考虑在内,因此采集多平台的日志并分析展示也在功能范围之内。当前,BC-DeepWatch平台已经可以采集展示BC-EPC以及BC-EC大部分组件的日志。
通过日志管理模块,运维人员免去手动登录到各平台服务器查看日志的繁琐步骤。直观快捷的在BC-DeepWatch平台查看各服务组件日志,让工作效率大大提升,此外,平台还提供服务器IPMI日志以及系统日志的集中展示,运维人员可据此分析服务器故障日常状况。
性能数据
在日常的运维过程中,运维人员需要对资源池内各类硬件设备及虚拟机的关键性能指标进行高精度监控,分析系统运行状况。
性能数据展示的设备种类丰富,不同的监控对象,其性能数据又有区别。至BC-DeepWatch V1.2.0产品发布,针对各类设备的指标项集数量已经达到736项,该指标数值在不断增加中。
采集架构:
性能数据展示:
告警管理
异构虚拟化环境使的运维复杂度不断提升,但运维平台仍需满足可靠性要求,因此具备故障自动发现、自动上报、自动修复的能力毋庸置疑。BC-DeepWatch从全方位提升运维能力,对物理资源、虚拟资源进行全面的故障告警采集、统一管理。
故障管理主要包括:关键进程故障管理、主机管理网、虚拟机故障告警管理。此外针对虚拟机、物理设备等关键指标的阈值告警同样在能力范围之内。
配置管理
BC-DeepWatch据此提供基础设施可视化的自动化运维能力。配置管理模块核心组件为Ansible,在此基础之上,产品结合业务场景,实现了批量系统配置、程序部署、脚本命令执行等功能。值得一提的,配置管理模块实现的这些功能,不需要在被管控主机上安装任何客户端,对比之前运维人员手动安装部署的方式,效率有了质的飞跃。
配置管理功能点:
配置管理展示:
可拓展性
BC-DeepWatch 在V1.2.0版本发布中,产品自身基于Ansible提供自动化部署工具,为产品的采集端扩容提供强有力支撑。
监控子系统
BC-DeepWatch本次发布中,包含监控子系统。该监控子系统包含性能监控及告警数据汇集两大块能力。该子系统可为DeepWatch对接其他平台提供便捷的方式。
当前BC-DeepWatch平台已经与BC-EPC完成对接,此外与BC-OP的对接也在进行中。
-6-
总结
大云运维管理平台(BC-DeepWatch)较上一代运维产品,从平台稳定性、数据准确性、采集多样性、告警及时性上有了大幅度提升。后续,BC-DeepWatch将功能上精益求精,加强产品前瞻性的研究。
- END -
(文字:云管平台产品组马小冲 / 视觉:云管平台产品组 岳畅、许倩)
如需进一步了解产品信息或获取产品版本,请访问【中移产品管理系统】-【产品库】
领取专属 10元无门槛券
私享最新 技术干货