由客户云上购买和使用的资源实例与产品产生的监控事件包括:
事件中文名称 | 事件英文名称 | 事件类型 | 从属维度 | 有无恢复概念 | 事件描述 | 处理方法和建议 |
集群健康状态异常 | ClusterHealthStatusAbnormal | 异常事件 | 集群维度 | 有 | 绿色:集群正常 黄色:部分副本分片不可用 红色:异常,部分主分片不可用 | 1. 检查集群分片是否可用 2. 如果确认存在分片不可用,采取相应措施修复 |
集群变为只读 | ClusterReadOnly | 异常事件 | 集群维度 | 有 | 整个集群变为只读状态 | 1. 检查是否人为设置 2. 集群只读是高危状态,导致不可写入 |
集群 search 语义异常 | ClusterSearchAbnormal | 异常事件 | 集群维度 | 有 | 整个集群查询语义异常 | search 语义异常导致文档查询不可用 |
节点磁盘使用率过高 | NodeDiskUsedAbnormal | 异常事件 | 节点维度 | 有 | 0:节点磁盘水位过高 | 检查节点磁盘是否设置合理 |
集群索引是否只读 | IndexReadOnly | 异常事件 | 集群索引维度 | 有 | 索引是否变为只读 | 1. 检查是否人为设置 2. 索引只读是高危状态,导致不可写入 |
集群是否存在节点离线 | ClusterNodeStatusAbnormal | 异常事件 | 集群维度 | 有 | 集群存在节点离线 | 集群节点离线,需要检查节点异常原因。例如是否存在高 I/O 和高 CPU 等 |