由客户云上购买和使用的资源实例与产品产生的监控事件包括:
事件中文名称 | 事件英文名称 | 事件类型 | 从属维度 | 有无恢复概念 | 事件描述 | 处理方法和建议 |
控制台操作事件(基于操作审计投递) | Console operations (CloudAudit) | 异常事件 | 实例维度 | 无 | 实例增删、变配等操作事件 | 人工排查 |
消费分组 rebalance | Consumer group rebalancing | 异常事件 | 消费分组维度 | 无 | 消费分组发生 rebalance | 人工排查 |
消息保留时间动态变更 | Dynamic change of message retention time | 异常事件 | 实例维度 | 无 | 磁盘占用率高触发了消息保留时间动态变更 | 评估是否需要升配磁盘规格 |
小程序操作事件(基于操作审计投递) | Mini program operations (CloudAudit) | 异常事件 | 实例维度 | 无 | 实例增删、变配等操作事件 | 人工排查 |
云 API 操作事件(基于操作审计投递) | Cloud API actions (CloudAudit) | 异常事件 | 实例维度 | 无 | 实例增删、变配等操作事件 | 人工排查 |
Broker 节点生产限流 | BrokerNodeProduceTrafficLimit | 异常事件 | Broker 维度 | 无 | Broker 节点触发生产限流 | 评估是否需要升配实例带宽规格 |
Broker 节点消费限流 | BrokerNodeConsumeTrafficLimit | 异常事件 | Broker 维度 | 无 | Broker 节点触发消费限流 | 评估是否需要升配实例带宽规格 |
消息队列 CKafka 故障事件 | ckafka break down | 异常事件 | 实例维度 | 无 | 实例故障 | |
集群节点下线 | Cluster node offline | 异常事件 | Broker 维度 | 无 | 集群有节点下线 | 查看集群节点是否正常 |
消费分组成员更新 | Consumer group member updated | 异常事件 | Broker 维度 | 无 | 有消费者组成员更新 | 查看消费组成员变更情况 |
可用区变更 | Availability zone changed | 异常事件 | 实例维度 | 无 | 实例变更了可用区 | 查看是否通过云 API 调用了变更可用区接口 |
集群节点上线 | Cluster node online | 异常事件 | Broker 维度 | 无 | 集群节点上线 | 查看集群节点是否正常 |
磁盘动态消息保留策略 | Dynamic Message Retention Policy | 异常事件 | 实例维度 | 无 | 磁盘占用率高触发了动态保留策略 | 评估是否需要升配磁盘规格 |
磁盘自动扩容 | Disk auto-extension | 异常事件 | 实例维度 | 无 | 磁盘占用率高触发了自动扩容 | 评估是否需要升配磁盘规格 |
消费分组成员心跳超时 | Consumer group member heartbeat timed out | 异常事件 | Broker 维度 | 无 | 有消费者心跳超时 | 查看消费者是否正常 |
Kafka 版本升级 | Kafka version upgrade | 异常事件 | 实例维度 | 无 | 实例升级了版本 | 查看是否通过云 API 调用了升级版本接口 |