智能运维系列(十四)| 人与技术相结合的异常管理实践
数字银行智能运维系列专题已经进入尾声,已经发表的文章从管理和技术上全面解释了如何构建智能根因分析系统。这篇文章主要阐述系统背后的IT异常事件管理思路,包含异常识别、异常影响评估和通报等,通过自动化、智能化手段来提升异常事件管理效率,帮助缩短平均修复时间(MTTR ,Mean Time to Repair)、增加平均无故障时长(MTTF,Mean Time To Failures),从而达到降低业务损失的目的。
前文回顾
专题 | 智能时代下的运维
一个异常事件的生命周期包含发现阶段、处...