概览

最近更新时间:2020-06-29 17:02:33

概览页展示了系统主要资源使用情况和服务运行情况。

主要 KPI 指标解释:

目前 TI-EMS 仅支持北京、广州、上海三个地域,切换顶部的地域栏,可查看不同 region下的统计数据。

资源概况

  • 公共资源组-CPU 使用:当前用户公共资源组运行的服务占用的总 CPU 核数。
  • 公共资源组-GPU 使用:当前用户公共资源组运行的服务占用的总 GPU 卡数。
  • 公共资源组-MEM 使用:当前用户公共资源组运行的服务占用的总内存量。
  • 专用资源组-CPU 使用:当前用户专用资源组运行的服务占用的总 CPU 核数。
  • 专用资源组-GPU 使用:当前用户专用资源组运行的服务占用的总 GPU 卡数。
  • 专用资源组-MEM 使用:当前用户专用资源组运行的服务占用的总内存量。

服务概况

  • 总服务配置数量:统计了当前用户所有服务配置的数量(包括所有配置的不同版本)。
  • 总运行服务数量:统计了当前用户的总运行中的服务数量(包括在线推理和批处理作业)。
  • 运行中/总在线推理数量:统计了当前用户运行中/所有状态的在线服务数量。
  • 运行中/总批处理作业数量:统计了当前用户运行中/所有状态的批处理作业数量。
  • Top10服务调用量:统计了当前用户所有运行服务中请求数量为前10的服务,单击任一服务,可查看其对应的服务请求曲线,同时也可以查看服务对应的配置情况和资源使用情况。
说明:

服务运行监控 Dashboard 可切换时间粒度分别为近3个小时、昨天、近3天、近5天、近7天和自定义时间区间。