作者:张加浪 腾讯云监控高级工程师
背景
十年一次的人口普查是涉及全国十几亿人的重大事情,每次人口普查都是对国人的一次梳理,国家和人民都十分重视。随着技术的不断创新,人口普查的普查方式也在不断升级,从人工加算盘到人工加老式计算机,再到卫星传感。
在第七次全国人口普查 (以下简称 “七人普”) 的到来之际,国家决定通过 “电子化方式普查登记,腾讯提供技术支持” 更快更准的普查方式,即实行云端普查登记。
七人普主要通过小程序方式进行制证、普查员注册、人口普查等,700 万的普查员,十几亿的普查对象,服务必然需要高并发、高可靠。腾讯云提供了全面的技术和资源支持,服务分成多个微服务模块和多场景(压测、试点、制证和普查等),用到了 CVM、CDB、Redis、TSF、WAF 等资源。涉及场景多、资源多、服务模块多,如何有效通过监控运维护航项目服务,面临着巨大挑战。
监控方案
基于七人普的服务特性以及涉及的多场景,监控方案一方面需要覆盖 IaaS、PaaS 和 SaaS,一方面需要覆盖多场景(试点、压测、普查、制证等)、多服务模块(后台、小程序、公共服务等)和多方人员需求(研发、运维、合作方、客户等)。
根据七人普的实际状况,需要考虑以下几个维度:
这些需求如何通过云监控来满足和实现呢?云监控是将指标、事件等类型的数据采集后,通过对数据的处理,可视化的展示给用户,并且在发生异常时,及时通知用户。云监控以监控中台(数据处理加工)、业务告警(告警配置)和 Dashboard(业务大屏)为一体,让客户只需腾讯云账号,即可完成全面的监控需求。
我们制定的用云监控护航七人普项目方案如下:
监控实现
七人普使用一体化的云监控产品完成监控需求,运维和开发等登录官网控制台后,可直接查看相关监控数据和配置,快速配置出监控大屏和相关告警。
七人普监控流程图
通过接入云监控的基础数据和业务自定义指标数据可配置出不同场景、不同用户视角的监控大屏,并且针对不同的子账号控制 Dashboard 查看和操作权限。
Dashboard 大屏列表
Dashboard 大屏
护航现场大屏
接入云监控的基础数据和业务自定义数据不仅可做大屏,相同数据源还可用于配置不同场景需求的告警策略,及时发现线上服务中发生的各种性能或业务异常问题。
告警规则列表
告警列表
自助订阅关心的腾讯云产品相关事件消息,便于客户更好维护好服务稳定性。
云监控事件中心
通过相关指标数据上报并对其做告警配置可及时主动发现项目中各种问题,同时也为分析问题提供了全面的性能或业务状态数据参考。
问题分析案例
上述是七人普使用云监控实现的一体化监控,简单的上报方式可覆盖基础和业务全量数据,使用相同数据源完成了 Dashboard 大屏和告警配置需求等。合理的使用云监控完成了七人普的监控护航,通过异常告警的接收,及时发现并处理了活动中的问题。
总结
云监控完成了对七人普项目的监控护航,主要涉及完整业务项目监控需求设计、监控方案制定和具体使用及问题发现分析处理等。云监控为腾讯云客户提供了全面、灵活、低门槛的监控服务。
同时,云监控也在不断深入拜访客户,研究更深层次的监控需求,为客户提供更高质量的监控服务。当前云监控能支持的场景有:
腾讯云产品基础监控;业务突发活动监控护航(如活动大促、广交会和疫情保障等)、业务自定义监控(如七人普监控专项)等。
更多的场景支持提升了云监控的能力,同时也使得为更多不同场景需求的客户提供更加专业的监控能力成为可能。
直播预约--12月9日(周三)晚7:00:
《云监控 Dashboard: 如何通过自研组件构建高性能监控可视化?》
欢迎联系云监控小助手微信号,加群讨论:)