操作指南

最佳实践

故障处理

API 文档

填写文档满意度调查问卷,赢取缤纷好礼> HOT

实例自助检测

最近更新时间:2022-07-26 17:02:19

概述

实例自助检测可检测云服务器实例的性能、费用、网络、磁盘等状态,并可帮助您了解实例的运行状态。您可通过该功能及时发现并解决实例的相关问题。

使用场景

以下两种场景推荐使用实例自助检测:

  • 故障处理:如在实例操作过程中遇到故障或问题,可使用实例自助检测进行问题排查及定位,并根据相应建议对异常情况进行处理。
  • 实例全面检测:日常运维过程中,可使用实例自助检测了解实例的整体运行状况,及时发现并解决问题,保障业务正常运行。

检测项说明

实例自助检测项目说明如下:

本地网络检测

展开&收起
检测项检测说明风险
等级
解决方案
网络延迟通过发送 HTTP 请求检测实例网络延迟是否过高。标准如下:
  • 大于600ms则判断为网络较差
  • 超过5s没有响应则认为此请求超时
  • 请求全部超时则判断为网络不通
异常请您检查本地网络问题,并对应具体问题进行修复。
网络抖动获取相邻请求的延时值差,其平均值为网络抖动值。网络抖动值/网络延时值小于等于0.15则表示网络稳定,大于0.15则表示网络有波动。-
上行带宽上传数据包至实例,以计算实例上行带宽-
下行带宽从实例下载数据包,以计算实例下行带宽-

安全组规则检测

展开&收起
检测项检测说明风险
等级
解决方案
安全组规则是否放通常用端口是否为安全组原因导致入方向的 TCP 协议的22、3389等常用端口的请求被禁止。警告实例安全组中入站(Ingress)规则的 TCP 协议的22端口的请求被禁止,可能会导致无法正常 SSH 登录。可放通所需端口,详情请参见 安全组应用案例

账户费用检测

展开&收起
检测项检测说明风险
等级
解决方案
云硬盘是否过期,实例与云硬盘到期时间是否一致实例关联的云硬盘是否已过期,是否无法读写使用云硬盘异常该实例的云硬盘已经过期,请前往 云硬盘控制台 尽快续费。
按量计费实例与非自动续费包年包月的云硬盘,是否因云硬盘过期而无法使用云硬盘警告该实例的云硬盘未设置自动续费,可能出现云硬盘过期导致不可用,建议前往 云硬盘控制台 设置云硬盘自动续费。
自动续费的包年包月实例与非自动续费的包年包月云硬盘,是否因云硬盘过期而无法使用云硬盘警告
非自动续费的包年包月实例和非自动续费的包年包月云硬盘,是否因两者的截止日期不一致,导致云硬盘过期无法使用警告该实例与其挂载的云硬盘到期时间不一致,可能出现云硬盘过期导致不可用,建议前往 云硬盘控制台 设置云硬盘自动续费。

实例存储检测

展开&收起
检测项检测说明风险
等级
解决方案
云硬盘是否出现高延时IO 性能 svctm 指标是否异常警告该实例云硬盘出现了高延时问题,建议您关注云硬盘使用情况。
云硬盘是否出现 IO HANG云硬盘是否出现 IO HANG警告该实例云硬盘出现了 IO HANG 问题,建议您关注云硬盘使用情况。
系统盘 inode 使用率云硬盘的 inode 使用率是否已达100%警告请您关注云硬盘使用情况,故障处理请参见 内核及 IO 相关问题
系统盘是否只读云硬盘当前是否处于只读状态异常
系统盘空间使用率云硬盘的磁盘使用率是否已达100%警告
磁盘分区有 IO 操作的时间与总时间的百分比云硬盘的 io_util 是否已达100%警告

实例网络检测

展开&收起
检测项检测说明风险
等级
解决方案
外网 IP 是否欠费不通外网 IP 是否欠费隔离异常外网 IP 可能因为欠费导致无法与外网互通,建议您前往 费用中心 尽快对账户进行充值续费。
是否有外网 IP实例是否有外网 IP警告该实例没有外网 IP,如您需要外网 IP 进行外网访问,可前往 弹性公网 IP 控制台 绑定 EIP。
外网 IP 是否被 DDOS 封堵外网 IP 是否被 DDOS 封堵异常该实例外网 IP 由于遭受 DDOS 攻击被封堵,请参考 解封防护 IP 文档进行处理。
外网带宽使用率实例是否在最近12小时内出现过外网入带宽过高警告为避免成为业务瓶颈,建议您检查网络使用情况。故障处理请参见 带宽占用高导致无法登录
实例是否在最近12小时内出现过外网出带宽过高警告
内网带宽使用率实例是否在最近12小时内出现过内网入带宽过高警告
实例是否在最近12小时内出现过内网出带宽过高警告
丢包情况实例最近12小时内是否触发限速导致 TCP 丢包警告为避免成为业务瓶颈,建议您检查业务健康情况。详情请参见 云服务器网络访问丢包
实例最近12小时内是否触发限速导致 UDP 丢包警告
实例最近12小时内是否触发软中断丢包警告
内核网络情况实例是否在最近12小时内出现过 UDP 发送缓冲区满警告
实例是否在最近12小时内出现过 UDP 接收缓冲区满警告
实例是否在最近12小时内出现过 TCP 全连接队列满警告
实例是否在最近12小时内出现过 TCP 请求溢出警告
连接数使用情况实例是否在最近12小时内出现过连接数达到上限警告

Linux 主机内部检测

展开&收起
检测项检测说明风险
等级
解决方案
SSH登录
相关
sshd 是否禁止密码方式登录/etc/ssh/sshd_config 文件中 ssh_password_authentication 是否为 yes警告sshd 配置已禁止密码登录,如需开放密码方式登录,请参考 处理步骤
sshd 是否禁止 root 用户登录/etc/ssh/sshd_config 文件中 ssh_permit_root_login 是否为 yes警告sshd 已禁止 root 用户登录,如需开放 root 用户登录,请参考 处理步骤
sshd 私钥文件权限/etc/ssh/ssh_host_rsa_key 文件权限是否有误警告ssh_host_rsa_key 权限配置有误,请参考 处理步骤 进行修复。
/var/empty/sshd 权限/var/empty/sshd 权限是否错误严重/var/empty/sshd 权限配置有误,导致无法登录,请参考 处理步骤 进行修复。
hosts_deny 配置/etc/hosts.deny 配置文件是否包含特殊登录规则警告/etc/hosts.deny 配置文件中包含特殊限制规则,可能导致无法登录,请参考 处理步骤 进行修复。
root 用户 shell 配置/etc/passwd 文件中 shell 配置是否错误严重/etc/passwd 文件 root 用户的 bash 配置有误,导致无法登录,请参考 处理步骤 进行修复。
wtmp 或 btmp 文件/var/log/wtmp 或 /var/log/btmp 文件是否过大警告/var/log/wtmp 或 /var/log/btmp 文件过大可能会导致登录缓慢,需清空对应文件,请参考 VNC 登录输入正确密码后无响应 进行修复。
sshd 进程依赖的动态库sshd 进程依赖的动态库是否存在严重sshd 进程依赖的动态库不存在,导致无法登录,请参考 处理步骤 修复。
/etc/profile 调用 /etc/profile是否存在 /etc/profile 调用 /etc/profile 死循环严重/etc/profile 调用 /etc/profile 死循环,导致无法登录,请参考 /etc/profile 死循环调用问题 修复。
sshd 进程ssh 进程是否存在严重sshd 进程不存在,需启动对应的 sshd 服务,请参考 处理步骤 修复。
网络配置
相关
网卡队列数网卡队列数是否未能全部开启警告网卡队列数是能全部开启,导致实例无法发挥最大网络性能,请参考 网卡多队列配置错误问题 修复。
NAT 环境内核参数是否因内核网络配置不规范,导致 NAT 环境丢包警告配置了 tcp_tw_recycle,则在 NAT 环境可能导致丢包,请参考 Linux 实例常用内核参数介绍 临时去除。
操作系统
环境相关
系统 limits 设置/etc/security/limits.conf 配置是否异常警告/etc/security/limits.conf 配置异常,可能导致无法登录,请参考 处理步骤 修复。
系统 OOM系统最近是否出现过 OOM严重系统出现过 OOM,建议评估内存使用是否合理或提升机型配置,请参考 实例内存使用率过高 排查及解决。
selinux 是否开启实例 selinux 是否开启警告开启 selinux 可能导致无法登录,建议先参考 处理步骤 关闭 selinux。
pid 是否耗尽实例 pid 是否耗尽严重系统 pid 即将耗尽,可能导致系统异常。建议评估系统启动的线程是否合理或调大系统的 pid_max,请参考 处理步骤 修复。
cloud-init 环境cloud-init 环境是否正常严重cloud-init 环境异常,可能会导致无法正常重置密码、修改主机名等,建议参考 Linux 系统安装 cloud-init 重装 cloud-init。
文件系统基本信息/etc/fstab 相关配置及文件系统检查警告/etc/fstab 配置了不存在的分区,实例重启后会导致启动失败,请参考 Linux 云服务器重启后云硬盘未自动挂载 排查及解决。
系统进入紧急模式/etc/fstab 相关配置是否异常严重/etc/fstab 相关配置异常可能导致系统进入紧急模式,请参考 /etc/fstab 配置错误导致无法登录 排查及解决。
防火墙检测防火墙规则是否异常警告iptables policy 设置了 drop 规则,则会导致网络联通异常,请参考 iptables policy 设置相关规则 排查及解决。
启动配置
相关
bin lib 软链接bin lib 软链接是否缺失严重bin lib 软链接有缺失,可能导致系统异常,请参考 系统 bin 或 lib 软链接缺失 重建对应软链接。
大页内存配置是否开启了大页内存警告系统内开启了大页内存,可能导致系统异常。请参考 sysctl.conf 配置大页内存 排查是否为业务程序配置,若不是则实例可能已被入侵。
动态库劫持配置是否配置了动态库劫持警告系统内配置了动态库劫持,可能导致系统异常。请参考 ld.so.preload 增加动态库劫持 排查是否为业务程序配置,若不是则实例可能已被入侵。
系统资源
使用率相关
CPU 使用率是否过高是否存在 CPU 使用率超过80%的进程警告CPU 使用率过高,建议评估是否合理或提升机型配置,请参考 CPU 或内存占用率高导致无法登录 排查及解决。
内存使用率是否过高是否存在内存使用率超过80%的进程警告 内存使用率过高,建议评估是否合理或提升机型配置,请参考 CPU 或内存占用率高导致无法登录 排查及解决。
文件系统 inode 使用率是否过大文件系统 inode 使用率是否已超过95%警告 磁盘空间使用率过大,可能导致系统异常,无法写入数据。建议评估是否可以删除部分文件或扩容硬盘大小,请参考 解决硬盘空间已满问题 修复。
文件系统空间使用率是否过大磁盘空间使用率是否已超过95%警告 磁盘 inode 使用率过大,可能导致系统异常,无法写入数据。建议评估是否可以删除部分文件或扩容硬盘大小,请参考 解决文件系统 inode 满问题 修复。

Windows 主机内部检测

展开&收起
检测项检测说明风险
等级
解决方案
操作系统
环境相关
Windows 操作系统版本Windows 操作系统是否为 Windows Server 2008 R2及更早版本系统警告Windows Server 2008 R2及更早版本系统在安全性、稳定性和兼容性方面均较差,且微软和腾讯云也已不再进行维护。建议参考 处理步骤 备份数据并重装 Windows Server 2016或更高版本系统。
内存限制是否设置了内存限制警告系统安装内存未得到充分利用,解除内存限制请参考 处理步骤
CPU 限制是否设置了 CPU 限制 警告系统分配 CPU 未得到充分利用,解除 CPU 限制请参考 处理步骤
句柄泄露句柄数是否正常警告可能存在进程句柄泄露,请参考 处理步骤 排查及解决。
系统暴力破解和攻击系统是否存在大量暴力破解和攻击警告系统可能因暴力破解或攻击存在卡顿或打挂影响正常业务,甚至有丢数据风险。请参考 安全组概述 通过控制台合理设置安全组策略,只放通必要的 IP 和端口。
系统环境变量系统环境变量是否正常警告缺少系统环境变量或环境变量异常,请参考 处理步骤 进行修复。
系统激活系统是否已被激活警告系统未激活,请参考 处理步骤 进行系统激活。
系统时间系统时间是否正确警告系统时间异常,请参考 处理步骤 进行修复。
系统路由表系统默认路由是否缺失警告系统缺少默认路由,请参考 处理步骤 进行修复。
系统 IE 代理系统是否设置 IE 代理警告系统已设置 IE 代理,请参考 处理步骤 进行排查。
CD-ROM 状态系统 CD-ROM 设备是否正常警告CD-ROM 异常,控制台重置密码需使用 CD-ROM,请参考 处理步骤 进行修复。
系统资源
使用率相关
内存使用率是否过高是否存在内存使用率超过80%的进程警告系统内存使用率过高,请参考 处理步骤 进行排查。
虚拟内存使用率是否过高虚拟内存资源是否不足严重系统虚拟内存使用率过高,请参考 处理步骤 进行修复。
总 CPU 使用率过高是否存在总 CPU 使用率超过80%的进程警告系统 CPU 使用率过高,请参考 处理步骤 进行排查。
单 CPU 使用率过高是否存在单 CPU 使用率超过80%的进程警告单个逻辑 CPU 使用率过高,请参考 处理步骤 进行排查。
磁盘可用空间不足磁盘使用率是否超过95%或者磁盘可用空间不足5GB警告磁盘可用空间不足,请参考 处理步骤 进行修复。
NTFS 系统元文件NTFS 元文件磁盘占比是否高警告NTFS 元文件占比过高,请参考 处理步骤 进行修复。
远程连接
相关
远程桌面服务状态远程桌面服务状态是否异常警告远程桌面服务状态异常,请参考 处理步骤 进行排查。
远程桌面服务端口远程桌面服务端口是否监听默认3389端口警告远程桌面服务端口未监听,请参考 处理步骤 进行修复。
RDP 侦听器RDP 侦听器是否启用严重RDP 侦听器未启用,无法远程登录,请参考 处理步骤 进行修复。
允许远程桌面连接是否允许远程桌面连接严重RDP 被禁用,无法远程登录,请参考 处理步骤 进行修复。
RDP 自签证书到期时间RDP 自签证书是否到期严重RDP 自签证书过期,可能无法远程登录,请参考 处理步骤 进行修复。
远程桌面服务角色安装及授权是否具备安装远程桌面服务角色和导入授权警告已开启多用户登录功能,且未导入 License,请参考 处理步骤 进行修复。
网络访问帐户网络访问本地帐户的共享和安全模型是否为 forceguest严重网络访问帐户为仅来宾,无法远程登录,请参考 处理步骤 进行修复。
远程桌面服务端口防火墙放通防火墙是否放通远程桌面服务警告Windows 内部防火墙未放通远程桌面服务端口,无法远程登录,请参考 处理步骤 进行修复。
网络配置
相关
端口耗尽TCP 和 UDP 端口数是否已耗尽严重可用端口已耗尽,请参考 处理步骤 进行修复。
Timewait/Closewait 连接数Timewait/Closewait 连接数是否正常警告Timewait/Closewait 连接数异常,可能导致无法远程登录,请参考 处理步骤 进行修复。
网关状态网关状态是否正常警告网关状态异常,请参考 处理步骤 进行修复。
MAC 地址是否为系统默认 MAC 地址严重MAC 地址非系统默认,请参考 处理步骤 进行修复。
内网域名解析腾讯云内网域名是否可以正常解析警告内网域名无法解析,请参考 处理步骤 进行修复。

实例状态检测

展开&收起
检测项检测说明风险
等级
解决方案
实例是否已关机目前实例是否已关机警告实例已关机,您可前往 云服务器控制台 开机。
实例是否重启实例是否在最近在12小时内出现过重启警告该实例在最近12小时内出现重启,请您关注实例运行状态。
实例内核崩溃实例是否在最近12小时内出现过 hungtask异常该实例在最近12小时内出现 hungTask/panic/软死锁,请您关注实例运行状态。故障处理请参见 内核及 IO 相关问题
实例是否在最近12小时出现过 panic异常
实例是否在最近12小时内出现过软死锁异常

实例性能检测

展开&收起
检测项检测说明风险
等级
解决方案
CPU 使用情况实例是否在最近12小时内出现过 CPU 负载过高警告为避免成为业务瓶颈,建议您检查 CPU 使用情况,并及时调整配置。故障处理则请对应实例操作系统,参考以下文档:
内存使用情况 实例是否在最近12小时内出现过内存负载过高警告
基础 CPU 使用情况实例是否在最近12小时内出现过 CPU 负载过高警告

相关操作

您可参考 使用实例自助检测 生成实例检测结果报告,或查看历史检测报告。

目录