产品事件列表

最近更新时间:2019-08-12 20:34:44

腾讯云云监控事件中心,产品事件当前支持以下事件类监控信息:

云服务器

事件中文名 事件英文名 事件类型 事件从属维度 有无恢复概念 事件描述 处理方法与建议
内核故障 GuestCoreError 异常事件 云服务器实例维度 操作系统内核bug或驱动问题导致操作系统内核发生致命错误 1.检查系统中是否有加载内核自身携带的内核驱动以外的其它内核驱动模块,尝试不要加载这些模块观察系统运行情况 2.关注内核与操作系统发行版的bug报告,尝试升级内核解决 3.腾讯云云服务器默认会开启kdump,发生panic时一般会在/var/crash下生成发生panic时的系统内存dump信息,可以利用crash工具进行分析
内存OOM GuestOom 异常事件 云服务器实例维度 系统内存使用过载 1.评估当前系统所配置内存是否满足业务内存需求,如果需要更大的内存建议升级CVM内存配置 2.通过系统日志(dmesg,/var/log/messages等)查看OOM发生时kill掉的进程,查看进程内存使用是否符合预期,通过valgrind等工具分析是否存在内存泄露
ping不可达 PingUnreachable 异常事件 云服务器实例维度 云服务器网络ping不可达 1.检查云服务器当前的运行状态是否正常,如果发生了系统挂死等情况,可以从控制台重启(强制重启)恢复 2.如果云服务器当前运行正常,检查云服务器网络配置,包括:云服务器内部的网络服务、防火墙、云服务器安全组设置等
磁盘只读 DiskReadonly 异常事件 云服务器实例维度 磁盘无法写入数据 1.检查磁盘的存储是否存在已满情况 2.Linux操作系统可以查看的inode(df -i)是否有耗尽的情况 3.检查文件系统是否损坏
机器重启 GuestReboot 状态变更 云服务器实例维度 云服务器重启 当云服务器被重启的时候,会触发该事件,请根据实际情况查看状态变更是否符合预期
外网出带宽超限导致丢包 PacketDroppedByQosWanOutBandwidth 异常事件 云服务器实例维度 云服务器实例外网出带宽超过主机的外网出带宽限制导致丢包。带宽毛刺导致的丢包不会体带宽视图中,原因:带宽最细统计粒度为10级(10秒内总流量/10秒)。若常量带宽没有明显超出也可忽略。 提高外网带宽上限。如果已达到可购买的最高上限,可通过负载均衡等方式降低单机带宽
连接数超限导致丢包 PacketDroppedByQosConnectionSession 异常事件 云服务器实例维度 云服务器实例连接数过多导致丢包 联系售后服务人员

负载均衡

事件中文名 事件英文名 事件类型 事件从属维度 有无恢复概念 事件描述 处理方法与建议
外网ip被封堵 VipBlockInfo 异常事件 负载均衡实例维度 负载均衡公网ip被攻击,安全侧检测异常后封堵 提工单查询具体的封堵原因和解封策略
服务器端口状态异常 RsPortStatusChange 异常事件 后端服务器端口维度 外网LB后端服务端口健康检查异常 查看后端服务端口的服务状态

VPN网关

事件中文名 事件英文名 事件类型 事件从属维度 有无恢复概念 事件描述 处理方法与建议
外网出带宽超限导致丢包 PacketDroppedByQosWanOutBandwidth 异常事件 VPN网关实例维度 VPN的外网出带宽超过限制导致丢包。带宽毛刺导致的丢包不会体带宽视图中,原因:带宽最细统计粒度为10级(10秒内总流量/10秒)。若常量带宽没有明显超出也可忽略。 提高外网带宽上限
连接数超限导致丢包 PacketDroppedByQosConnectionSession 异常事件 VPN网关实例维度 VPN网关实例连接数过多导致丢包 联系售后服务人员

容器服务

事件中文名 事件英文名 事件类型 事件从属维度 有无恢复概念 事件描述 处理方法与建议
节点异常 NodeNotReady 异常事件 集群维度 节点异常可能由多种原因导致,例如网络不通,节点kubelet异常,容器造成OOM等都会致使此异常发生。节点长时间异常,会造成kubenetes主动驱逐该节点上的容器。 1.首先排查节点在CVM页面是否运行中,监控是否有异常。2.登录到子机查看kubelet是否运行正常。3.登录到子机查看docker是否运行正常
节点磁盘空间将要耗尽 NodeHasDiskPressure 异常事件 集群维度 节点上容器和镜像存储所用到的磁盘(cbs或者root)空间将要耗尽,如果耗尽,将触发NodeOutOfDisk,会致使新的容器无法在被调度到此节点 清理磁盘或者无用的容器镜像
节点磁盘空间已耗尽 NodeOutOfDisk 异常事件 集群维度 节点上容器和镜像存储所用到的磁盘(cbs或者root)空间已经耗尽,新的容器无法在被调度到此节点 清理磁盘或者无用的容器镜像
节点内存将要耗尽 NodeHasInsufficientMemory 异常事件 集群维度 节点内存使用率偏高 扩容或者调度容器到其他节点
节点OOM SystemOOM 异常事件 集群维度 节点由于内存过高而发生OOM 检查当前节点上触发OOM的原因,例如查看监控,syslog,demsg等
节点节点网络不可达 NodeNetworkUnavailable 异常事件 集群维度 节点上网络没有被正确配置, 正常情况下,从控制台或云API创建的集群不会出现此问题。 及时提交工单或与售后服务人员联系
节点Inode不足 NodeInodePressure 异常事件 集群维度 节点Inode不足会造成节点无法创建新的容器 检查节点上Inode的剩余情况,可以尝试清理无用的容器镜像释放Inode空间

云数据库 MongoDB

事件中文名 事件英文名 事件类型 事件从属维度 有无恢复概念 事件描述 处理方法与建议
备份 oplog 不足 oplogInsufficient 异常事件 云数据库 MongoDB 实例维度 云数据库 MongoDB 在备份时,无法读取到上次备份到本次备份的完整 oplog,这将影响您的数据库回档到 7 天内的任意时间点。 建议在腾讯云官网控制台调整云数据库 MongoDB oplog 的大小或备份频率;如您不需要该事件通知,可以在腾讯云官网 MongoDB 控制台备份界面进行设置以关闭该事件通知。
连接数超限 connectionOverlimit 异常事件 云数据库 MongoDB 实例维度 实例连接数使用超过限制 评估当前实例所配置连接数是否满足业务需求,如果需要更大的连接配置建议升级腾讯云 MongoDB 数据库实例配置。
主从切换 primarySwitch 异常事件 云数据库 MongoDB 实例维度 实例 Primary 和 Secondary 切换 当物理机故障时可能会触发该事件,请确认实例状态是否正常。
磁盘空间已耗尽 instanceOutOfDisk 异常事件 云数据库 MongoDB 实例维度 磁盘空间写满,造成实例只读 清理磁盘空间
实例 Rollback instanceRollback 异常事件 云数据库 MongoDB 实例维度 实例数据 rollback 当主节点有部分数据还没有及时同步到从节点时主节点故障并发生主从切换可能会触发该事件,请确认实例状态是否正常。