API 文档

异常诊断

最近更新时间:2021-08-04 16:30:46

异常诊断功能为用户的数据库实例提供实时的性能监控、健康巡检、故障诊断和优化,让用户既可以直观地感知数据库实例实时的运行状况,也可以定位实时出现的性能异常,并根据优化建议进行系统优化。异常诊断提供实时和历史两种查看方式。
本文将介绍如何使用该功能诊断和优化数据库实时/历史异常。

说明:

异常诊断目前支持云数据库 MySQL(不含单节点 - 基础型)、云原生数据库 TDSQL-C(TDSQL-C for MySQL)、自建数据库 MySQL、云数据库 Redis。

登录 DBbrain 控制台,在左侧导航选择【诊断优化】,在上方选择对应数据库,然后选择【异常诊断】页。

实时/历史监控

在异常诊断页主要展示 CPU 利用率、内存使用率、磁盘使用率、输入/输出流量、健康得分信息,其中,磁盘使用率详情可单击右上角的【详情】查看。数据库健康得分结合 AI,更贴合用户数据库真实运行状况。

实时/历史诊断

  • “实时/历史诊断”栏:展示实例实时的 Running Threads 数、CPU 使用率以及诊断事件。
  • “诊断提示”栏:展示诊断事件历史记录的概要信息,包括等级(分为健康、提示、告警、严重、致命)、开始时间、诊断项、持续时长。DBbrain 会定期(每10分钟)的对实例进行健康巡检。

查看诊断详情

  1. 登录 DBbrain 控制台,在左侧导航选择【诊断优化】,在上方选择对应数据库,然后选择【异常诊断】页。
  2. 在实时/历史诊断视图中,鼠标选择对应时间段,可拉伸该时间段的诊断视图,查看更细粒度的视图详情。单击【查看详情】或“诊断提示”栏的记录项可进入诊断详情页。
  3. 在视图单击诊断事件,会显示该事件的详情。
    • 事件详情:包括诊断项、起止时间、风险等级、持续时长、概要等信息。
    • 现场描述:异常事件(或健康巡检事件)的外在表现现象的快照和性能趋势。
    • 智能分析:分析导致性能异常的根本原因,定位具体操作。
    • 优化建议:提供优化指导建议,包括但不限于 SQL 优化(索引建议、重写建议)、资源配置优化和参数调优。

      在【优化建议】页,单击【优化对比】,在弹窗中可以查看 SQL 执行计划、索引建议、表结构以及 SQL 优化前后代价对比。
      SQL 代价通过分析 SQL 相关库表的统计信息、OPTIMIZER_SWITCH 配置、及索引字段区分度进行估算,对优化后的 SQL 语句代价进行整体估计,使用可视化图表直观呈现 SQL 优化后降低的效果,您也可通过优化前后的执行计划比对进一步验证优化的效果。

忽略/取消忽略告警

  1. 登录 DBbrain 控制台,在左侧导航选择【诊断优化】,在上方选择对应数据库,然后选择【异常诊断】页。
  2. 在实时/历史诊断视图右侧的“诊断提示”中,单击任意一条异常告警的【忽略】及【取消忽略】,可忽略及取消忽略同类告警信息。
    • 单击【忽略】,从忽略后,该实例由相同根因产生的诊断项告警也将被忽略。对于已被忽略的异常告警信息,将会被置灰色。
      说明:

      该功能仅针对诊断项为非“健康巡检”的异常告警。

    • 单击【取消忽略】,从取消忽略后,该实例由相同根因产生的异常告警也将被取消忽略。默认不显示已忽略的诊断项。

实时/历史 SQL

  • “实时/历史SQL”展示实例的请求数汇总和分布,包括总请求数、查询(Select)、替换(Replace)、插入(Insert)、删除(Delete)、更新(Update)的趋势信息。
  • “实时/历史慢SQL”展示慢 SQL(slow log)和 CPU 使用率的趋势,单击右上角的【查看详情】可跳转至【慢 SQL 分析】页面,查看分析详情。
说明:

直连方式接入的自建数据库实例,因无法采集主机资源监控指标,故部分功能无法展示。建议采用 agent 方式接入自建数据库实例。

目录