指标:选择云产品类型和需要监控的指标。本例选择云服务器-基础监控,监控指标以基础 CPU 使用率为例。
筛选:对监控数据源进行筛选。本例选择实例 ID 后即可选择该图表需要监控的实例,本图表选定的监控对象为所属帝企鹅业务的前端主机3台。
group by:类似 SQL 的 Group by 功能,根据指定标签对数据进行分组后再按照聚合算法聚合。本例选择实例 ID 后即可预览到3条曲线,其对应3台前端主机的基础 CPU 利用率。
2. 单击新建图表,配置聚合图表内容如下所示。
本例新建图表前端-基础 CPU 平均使用率,其目的是监控前端3台主机的平均 CPU 使用率。图表名、监控类型、指标、筛选的配置方法与明细图表一致。
group by:对于聚合图表此处不选择标签,而应选择聚合方法。目前提供 sum、max、min、avg 四种聚合方法,本例选择 avg 方法后即可预览到前端3台主机的基础 CPU 平均使用率,如下图所示。
3. 新图表创建后如下,此时需要将新建图表拖拽到所属图表组,并拉伸到需要的大小。
4. 新建完成。此时对已完成帝企鹅业务的3台前端主机的 CPU 单机利用率和平均利用率的基础图表创建,接下来将对这两个图表进行更高级的配置以完成更高效的监控工作。
步骤3:图表高级配置
1. 同环比曲线配置。
对于前文配置的前端-基础 CPU 平均使用率聚合图表,单条曲线的趋势无法快速定位问题,配置同环比曲线可以实现对当前数据与昨天和上周同时段进行对比,如图所示,配置后的3条曲线对比分析将能更快速凸显数据异常。
2. 图例配置及其排序。
对于前文配置的前端主机-基础 CPU 使用率明细图表,默认情况下可从图表查看到曲线最大值,而当前面对多条波动较复杂的曲线,用户可以增加最小值、平均值、求和等多种汇总函数的图例,丰富指标数据以查看和分析一段时间的整体趋势。同时,利用图例排序针对一批资源的不同数值分别进行排序,可快速发现异常数据以及对应的资源对象。
3. 链接跳转配置。
Dashboard 为图表配置提供数据与图表两个位置的链接跳转,供用户配置多种个性化运维场景,如下图为前端-基础 CPU 平均使用率配置的两个使用场景:
1. 使用模板变量动态分析指标。
模板变量为用户实现在相同的 Dashboard 中动态切换不同的数据源,用户可以动态选择模板变量捆绑的标签值,随时在同一套图表中展示不同的数据。例如,我们可以对前文配置的前端-基础 CPU 平均使用率进行改造,目标图表为可以动态改变数据源实例的模板变量-基础 CPU 平均使用率,如下步骤: