有奖征文:轻量对象存储LighthouseCOS用户实践> HOT
文档中心 > 云服务器 > 操作指南 > 维修任务 > 维修任务类型与处理策略
当平台监控到影响实例可用性及运行性能的异常情况时(例如底层宿主机突发异常宕机,或主动预测底层宿主机的软硬件故障隐患以提前规避宕机风险),平台将立即发起维护流程、记录对应的维修任务,并向用户推送受影响实例的故障或隐患通知。您在收到相关通知后,可及时前往 维修任务控制台,查看异常实例的维修时间及处理进度,并授权平台对异常实例进行维护以恢复正常运行状态。
云服务器实例的维修任务按照触发原因进行分类,可分为以下多种类型,每种任务类型的具体含义、应对建议及可选授权策略如下表所示:

维修任务分类

任务类型
任务含义
应对建议
可选授权策略
实例运行异常
实例底层宿主机突发软硬件故障或系统错误,导致实例异常宕机或重启。
当监控到实例运行异常类型的维修任务触发时,平台已在第一时间执行相关维护操作,并尝试对异常实例进行重启以快速恢复实例可用性。
建议您等待实例自动重启完成,并关注维修任务状态更新进展。
根据维修任务的当前状态,判断下一步处理策略:
任务为“处理中”状态时,平台正在紧急对异常实例进行相关维护操作。维护完成后会及时同步更新任务状态,并向您推送相关通知。
任务为“已结束”状态时,异常实例已自动重启完成并恢复运行,您可验证实例和应用是否恢复正常。
实例运行隐患
实例当前运行正常,但监控到实例宿主机或底层平台存在软硬件隐患,可能导致实例性能抖动,或存在异常宕机风险。
为尽快完成维护以规避底层软硬件隐患,避免潜在的宕机风险,建议您提前备份好业务数据,并尽快前往维修任务控制台:
1. (可选)进行实例数据的备份。
2. 授权平台立即发起维护,或提前预约48小时内的计划维护时间。
3. 等待系统在计划维护时间自动发起维护。
根据实例底层隐患的修复方式,可选择以下方式授权处理:
在线迁移授权(实例无需停机,迁移过程中云服务器可能出现短时间高负载或者网络抖动)。
停机维护授权(实例重启快速恢复)。
注意:
1. 如用户超过48小时未授权,系统将在计划维护时间默认发起维护。
2. 本地盘实例暂不支持重启快速恢复,需较长维护周期以修复底层硬件隐患。如有需要,用户可选择重新部署本地盘实例以快速规避隐患(本地盘数据无法保留)。
实例硬盘异常
实例本地硬盘突发故障,可能导致实例 I/O 性能降低或硬盘功能受损。
为尽快完成维护以恢复异常硬盘可用性,建议您提前备份好业务数据,并尽快前往维修任务控制台:
1. (可选)进行实例数据的备份。
2. 授权平台立即更换异常硬盘,或提前预约48小时内的计划维护时间。
3. 等待平台对异常硬盘完成更换,并根据恢复通知中的操作提示,重新挂载并使用更换后的本地硬盘。
根据本地盘实例异常硬盘的修复方式,可选择以下方式授权处理:
在线换盘(实例在线更换异常硬盘,维护过程中异常硬盘短时间内 I/O 暂不可用,处理完成后可根据提示挂载并使用新盘)。
停机换盘(实例需停机更换异常硬盘,有可能保留本地盘数据,但需较长维护周期)。
(可选)弃盘迁移:重新部署本地盘实例,本地盘数据无法保留。分钟级快速恢复实例可用性。
实例硬盘预警
实例本地硬盘存在坏盘隐患或使用寿命即将耗尽,可能导致实例 I/O 异常或磁盘掉线等数据层面异常。
为尽快完成维护以消除本地硬盘潜在的故障风险,建议您提前备份好业务数据,并尽快前往维修任务控制台:
1. (可选)进行实例数据的备份。
2. 授权平台立即更换隐患硬盘,或提前预约48小时内的计划维护时间。
3. 等待平台对异常硬盘完成更换,并根据恢复通知中的操作提示,重新挂载并使用更换后的本地硬盘。
根据本地盘实例异常硬盘的修复方式,可选择以下方式授权处理:
在线换盘(实例在线更换异常硬盘,维护过程中异常硬盘短时间内 I/O 暂不可用,处理完成后可根据提示挂载并使用新盘)。
停机换盘(实例需停机更换异常硬盘,有可能保留本地盘数据,但需较长维护周期)。
(可选)弃盘迁移:重新部署本地盘实例,本地盘数据无法保留。分钟级快速恢复实例可用性。
实例网络连接异常
实例底层网络连接突发故障,可能会引起实例网络抖动或导致网络连接异常。
当监控到实例网络连接异常类型的维修任务触发时,平台已在第一时间对底层网络执行相关维护操作,并尝试恢复异常实例的网络连接可用性。
建议您等待实例网络连接自动修复完成,并关注维修任务状态更新进展。
根据维修任务的当前状态,判断下一步处理策略:
任务为“处理中”状态时,平台正在紧急对异常实例底层网络进行相关维护操作。维护完成后会及时同步更新任务状态,并向您推送相关通知。
任务为“已结束”状态时,异常实例网络连接已恢复正常,您可验证实例和应用是否恢复正常。
实例维护升级
实例因底层宿主机架构、软件升级等原因需要发起在线维护,以提升实例性能及安全性。
为尽快完成维护以提升实例性能及安全性,建议您提前备份好业务数据,并尽快前往维修任务控制台:
1. (可选)进行实例数据的备份。
2. 授权平台立即发起维护,或提前预约48小时内的计划维护时间。
3. 等待系统在计划维护时间自动发起维护。
可选择以下授权方式:
在线维护(实例无需停机,维护过程中云服务器可能出现短时间高负载或者网络抖动)。
注意:
如用户超过48小时未授权,系统将在计划维护时间默认发起维护。

任务状态

任务状态
含义
待授权
等待用户授权,用户可选择授权维护方式和维护时间。非硬盘类维修任务如超过48小时用户仍未授权,则系统将在计划维护时间默认发起维护,并将维修任务转为处理中状态。
已预约
用户已操作授权,并预约维护时间。在任务创建的48小时之内,可修改系统默认的计划维护时间。
处理中
维修任务正在执行中。
已结束
维修任务已处理完成。
已避免
当实例存在未结束的维修任务时,用户对实例进行退还、销毁、调整配置等操作时,将中断避免本次维修任务流程。
已取消
本次维修任务已被系统取消。