可用性监控

最近更新时间:2019-04-12 17:21:14

操作场景

可用性监控任务专注于站点/端口可用性。您只需要输入您的服务地址,分布全国的拨测点将自动对您的站点发起探测,并记录探测情况。根据实时探测数据,统计站点可用情况,支持实时告警,并提供详细的探测日志供用户了解服务运行情况。
可用性监控提供的主要性能指标为可用率,帮助您快速了解服务运行情况,快速发现并定位问题。下面将为您详细介绍如何创建可用性监控任务。

操作步骤

创建可用性监控任务

  1. 登录 云拨测控制台 进入可用性监控列表页。
  2. 单击页面左上角的【新建任务】按钮,进入新建任务页,根据以下步骤进行配置。
  3. 配置拨测名称和拨测协议。
    • 拨测名称:监控任务的名称,推荐以监控对象来命名。
    • 拨测协议:根据网站提供的服务来选择拨测协议。
      http(s):适用于监控 Web 站点的服务质量。
      tcp:适用于监控服务器的 TCP 端口。
      ping:适用于对指定服务器的 ping 值监控(是否能 ping 通)。
      udp:适用于监控服务器的 UDP 端口。
      dns:适用于监控站点的域名解析服务。
      smtp:适用于提供收邮件服务的站点监控。
      pop3:适用于提供发邮件服务的站点监控
      ftp:适用于提供文件服务的站点监控。
      2
      单击【显示高级配置】,还可对所选的拨测协议进行高级配置。在配置过程中,将鼠标移动到处,即可显示
      该配置项的详细说明。
  4. 配置“触发条件”,详细说明如下。
    • 拨测周期与拨测点:在可用性监控中,您不需要配置拨测周期与拨测点。默认通过分布全国的3个拨测点,以1分钟频率进行拨测。
    • 触发条件:配置拨测任务告警的触发条件,在您的拨测任务达到触发条件时,我们将记录一条告警,并依据您配置的 告警渠道告警接收组 向您发送告警信息。
      所有拨测点均访问不通:一个拨测周期中,所有拨测节点访问您的服务/端口都失败了,即为所有拨测点访问不通触发告警。当有任一个节点访问成功时,告警恢复。
      可用率 说明 处理机制
      最近10分钟可用率 统计近10分钟内所有拨测周期中(总的拨测成功次数/拨测总次数)* 100,即模拟10分钟内用户访问您的站点的成功率 当这个比例小于您设定的最低阈值时,将触发告警。当可用率高于您设定的阈值时,告警将恢复。
      最近15分钟可用率 统计近15分钟内所有拨测周期中(总的拨测成功次数/拨测总次数)* 100,即模拟15分钟内用户访问您的站点的成功率
      最近20分钟可用率 统计近20分钟内所有拨测周期中(总的拨测成功次数/拨测总次数)* 100,即模拟20分钟内用户访问您的站点的成功率
      最近30分钟可用率 统计近 30 分钟内所有拨测周期中(总的拨测成功次数/拨测总次数)* 100,即模拟30分钟内用户访问您的站点的成功率
      最近60分钟可用率 统计近60分钟内所有拨测周期中(总的拨测成功次数/拨测总次数)* 100,即模拟60分钟内用户访问您的站点的成功率
  5. 配置接受管理。
    配置拨测任务告警的接受方式和接收人,我们将依据您配置的 告警渠道告警接收组 向您发送告警信息。
  6. 配置“回调接口”(可选)。
  7. 在配置以上选项之后,单击【保存】,即可创建可用性监控任务。

管理可用性监控数据

  1. 登录 云拨测控制台 ,进入可用性监控列表页。
  2. 在列表中找到需要操作的目标任务,在列表最右侧的“操作”列下,单击【配置/暂停/运行/复制/删除】,即可对可用性监控任务进行相应的管理。

查看可用性监控数据

  1. 登录 云拨测控制台 ,进入可用性监控列表页。
  2. 在列表中找到需要操作的目标任务,单击【拨测名称】,进入可用性监控详情页,即可查看可用性监控的拨测数据和故障记录。