全栈监控
一个好的监控为了两个场景而设计
容量管理 提供一个全局的系统运行时数据展示,可以让其它工程师知道是否需要加机器或资源
性能管理 可以通过查看大盘,找到系统瓶颈,并能有针对性的优化
定位问题 快速的暴露并找到问题的发生点,帮助技术人员诊断问题
性能分析 当出现非预期流量提升时,快速找到系统节点
其架构可以用下图表示
包括三层
1)基础层:监控主机和底层资源。比如cpu、内存、网络吞吐、硬盘I/O、硬盘使用等 2)中间层: 包括nginx、Redis、MQ、MySQL、Tomcat等 3)应用层:HTTP访问的吞吐量、响应时间、返回码、调用链路分析、性能瓶颈,还包括用户端的监控等 此外,有了这些监控后,需要将数据能落实到日志系统,需要 1)日志数据格式化 2)监控数据格式标准化 3)统一的监控平台 4)统一的日志分析
而一旦有了上述数据我们就可以达到如下目标。