在上一期《数据中枢》中介绍的配置数据管理工具 CMDB,配合云哨监控系统的预设告警策略,可以实现常用监控告警的自动化配置。今天我们的主角就是运维平台中的最强警戒线——云哨系统。
什么是云哨
TCE 提供了丰富的云产品及其配套的运营、运维能力,交付客户后这些产品自身的健康度将直接决定客户能否顺利使用其提供的资源和服务,基于此背景云哨就应运而生了。
云哨作为 TCE 运营端的一站式监控系统,为云产品与云底座提供统一监控能力,通过丰富的指标数据、实时的告警、灵活的数据展示能力,及时发现系统异常,7*24h为服务正常运行保驾护航。
在哪些场景下使用
产品的价值
关键能力
故障发现
故障通知
故障恢复
故障定位
系统健康度大盘
监控作为运维中重要的一环,未来会继续引入告警知识库、调用链分析、AIOps 等更多高级能力,不断完善监控场景、提升运维效率,为客户带来更大价值,大家敬请期待!
感谢本期作者王怡宁为我们带来的专业解说,对运维平台有兴趣的朋友们可以点一下关注,咱们下周见!
-【END】-