操作指南

云产品指标

文档中心 > 云监控 > 最佳实践 > 实例分组在告警中的应用

实例分组在告警中的应用

最近更新时间:2020-09-18 10:41:42

本文将为您介绍如何实现按业务分类,对同一产品大批量跨实例、跨地域的项目,统一设置告警策略。

简介

随着业务的发展,云产品资源不断增加,成为了日常监控与运维的瓶颈。您可以使用云监控实例分组功能,将大批量的云产品资源按业务进行分类。对同一分组下的实例统一设置告警策略,及时了解其使用和运行情况,迅速提升运维效率。

应用场景

假设我们有5台云服务器,其中3台(CVM-1、CVM-2、CVM-3)用于 A 游戏业务,其余2台用于其他业务。

  • CVM-1 位于广州地域、属于 A 项目。
  • CVM-2 位于上海地域、属于 B 项目。
  • CVM-3 位于北京地域、属于 C 项目。

现需及时了解 A 游戏业务三台云服务器的使用和运行情况。需做如下配置。

  1. 创建实例分组。将 CVM-1、CVM-2、CVM-3 三台云服务器加入同一实例分组。
  2. 创建告警策略。包含 CPU 利用率、内存利用率、磁盘利用率、外网出带宽(监测流量使用情况)等指标。当任一实例指标达到一定阈值后自动发送告警通知。
    说明:

    云服务器告警需要云服务器实例 安装云服务器监控控件 上报监控指标数据后才能正常发送。在云产品监控页面可以查看未安装监控 agent 的云服务器,并下载 IP 列表。

实例分组

  1. 进入 云监控控制台—实例分组
  2. 单击【新建】,配置实例分组内容如下所示。
    • 分组名:命名为 “A游戏业务”。
    • 分组类型:选择云服务器—基础监控。
    • 添加至组:将 CVM-1、CVM-2、CVM-3 添加至实例分组。
  3. 配置完成后,单击【保存】即可。

创建告警

  1. 进入 云监控控制台—告警策略
  2. 单击【新建】,根据页面提示进行配置。
    • 策略名称:由您自定义。
    • 策略类型:选择云服务器—基础监控。
    • 策略所属项目:可选择默认项目。
    • 告警对象:选择实例组—A游戏业务。
    • 告警触发条件。
      • CPU 利用率 、统计周期1分钟 、>85%、持续1个周期、每天告警一次。
      • 内存 利用率 、统计周期1分钟 、>85%、持续1个周期、每天告警一次。
      • 磁盘 利用率 、统计周期1分钟 、>85%、持续1个周期、每天告警一次。
      • 外网出带宽 、统计周期1分钟 、100Mbps、持续1个周期、每天告警一次。
    • 告警渠道。
      • 告警对象:选择告警通知需要发送的对象。
      • 有效时间段:自定义告警通知有效时间,默认为全天有效(即 00:00:00 - 23:59:59)。
      • 接收渠道:支持邮件、短信、微信接收渠道。您可以根据实际情况选择接收渠道。

  3. 配置完成后,单击【完成】即可。
目录