概览

最近更新时间:2019-08-08 15:21:54

概览页分为【资源使用概况】和【服务运行概况】。系统资源概况展示了系统的 CPU 资源和 GPU 资源的使用情况,服务运行概况展示了系统服务运行主要的 KPI 指标。

主要 KPI 指标解释:

目前 TI-EMS 仅支持北京可用区,系统资源统计均表示北京 region 的统计数据。

系统资源概况

  • CPU 使用:当前用户在 TI-EMS 运行服务占用的 CPU 核数。
  • GPU 使用:当前用户在 TI-EMS 运行服务占用的 TFLOPS 算力。
  • 内存使用:当前用户在 TI-EMS 运行服务占用的内存总量。

服务运行概况

  • 运行中/总模型服务数量:统计了当前用户的总模型服务数量和状态为正在运行中的服务数量。
  • 总服务配置数量:统计了当前用户所有服务配置的数量(包括所有配置的不同版本)。
  • 请求数量:统计了当前用户所有服务总的请求数量。
  • 请求失败数量:统计了当前用户所有服务总的请求失败的数量。
  • 最大调用量:统计了当前用户所有运行服务中调用量最大的服务所对应的请求数量。
  • Top10服务调用量:统计了当前用户所有运行服务中请求数量为前10的服务,单击任一服务,可查看其对应的服务请求曲线,同时也可以查看服务对应的配置情况和资源使用情况。

    说明:

    服务运行概况 Dashboard 可切换时间粒度分别为近3个小时、昨天、近3天、近5天、近7天、近30天和自定义时间区间。