前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >3.1 运维流程无处不在

3.1 运维流程无处不在

作者头像
彭华盛
发布2021-01-18 14:26:53
9750
发布2021-01-18 14:26:53
举报
文章被收录于专栏:运维之路运维之路

在运维适应性系统中,随着运维能力需求不断提升,运维组织面临的机器、人、协同关系等不确性特征越来越明显。为了更好的传递公司数字化转型价值创造,确保公司价值产出过程的有序运作,需要建立以价值驱动的运维流程管理,以持续提升运维组织整体运作效率和价值实现,落实运维的能力建设。良好的流程可以帮助运维建立复杂环境的适应性能力,即围绕“需求、改变、风险、适应”四个要素闭环螺旋上升(闭环模型参见《运维挑战:如何构建复杂环境下的适应性系统》)。

流程是运维系列的第3部分,我尝试以我的理解介绍一下:

• 变更管理涉及的评审、发布、窗口、devops、环境交付、运维前移、变更运营等(3.2章节);

• 故障管理涉及的故障前的防范与挖掘、故障中的应急与协同、故障后复盘、突发事件、问题、故障数据运营(3.3章节);

• 演练、混沌、灰度(3.4章节);

• 业务连续性,架构高可用,架构评审等(3.5章节);

• 服务管理的服务分级、服务目录,服务台等(3.6章节);

• 数据运营涉及的容量、性能、业务运营、成本等(3.7章节);

• 知识管理、预案、文档等(3.8章节);

• 配置管理涉及的数据规范、运营、消费(3.9章节);

作为运维从业者,也许你不能讲出什么是流程,但一定对服务台、事件、问题、变更、发布、配置、服务级别、连续性、知识等流程不陌生。国内的中大型企业为了保障公司信息系统业务连续性、提升IT服务质量,通常以ITIL、ISO20000、ITSS为基础,标准化企业的运维流程,固化于IT流程/服务管理系统,并配套流程管理横向角色以建立PDCA的持续优化机制。在进入到运维流程之前,3.1章先尝试从流程的定义、作用、持续优化思路、流程与制度规范的关系、流程与服务的关系,以及运维常见流程的关系几个点进行分析。

3.1.1 流程的误区与作用

通常流程是有规律的行动,这些行动以确定性的方式执行,能产生特定的结果。流程这种增强确定性的特点与以业务连续性保障为底线的运维组织十分契合,所以二十年前的ITIL流程管理理念对于现在的运维组织仍广泛受用。当然,也有人认为运维流程已不适合当前强调敏捷与快速交付的IT价值创造,以下列举一些对运维流程反面观点以及我对这些观点的想法:

1.运维流程的确定性阻碍创新,增加了事务性投入。无规矩不成方圆,如果没有流程,同一项任务,不同的人会生产出不确定性的输出,当不确定性输出累加到一定程度,便将暴露风险。风险产生后,需要调用大量人力去解决风险。另外,还要关注一点,由于风险的破坏性,通常解决风险的人员通常是运维、研发、测试、产品最强的人员。所以流程增加部分投入的同时,更多的改善了系统质量,减少投入到风险应急的投入。

2.流程增加了交付时间,减缓了软件交付效率。软件交付流程贯穿整个软件生命周期各个细节。比如,大家常说的devOps提升交付效率,实际上devOps的关键难点是流水线的梳理,从大的CI/CD流水线的节点,以及流水线节点pipeline任务,本质上就是流程。只有能够将无序的工作标准化,固化为流程,才有办法实现自动化,如果说流程减缓软件交付效率,更多说这个流程有待进一步优化。

3.流程只加不减越来越臃肿。流程需要维护,造成流程臃肿的原因,个人觉得是缺乏“管理流程”的“流程”,虽然流程在创建之初通常职责、任务、责权利相对清晰,但是随着组织架构增大,流程节点会越来越长,会出现流程效率下降的问题,此时需要有专人或专门的机制持续反思优化流程。

4.运维流程就是ITSM或ITIL。很多人一提到流程就会想到ITIL或ITSM,我觉得有两个误区。一是ITIL是一个最佳实践,不能包含运维组织所有工作,组织流程除了变更、发布、事件、问题等流程以外,常规的值班管理、演练执行、常规巡检等同样涉及流程;二是ITSM是一个以服务驱动的IT管理方法,他不仅仅是一个流程管理的系统。

对于流程的价值,我觉得可以从运维管理体系来分析。组织、流程、平台、场景形成了运维复杂性适应性系统的四个要素,以人角度看复杂性适应性系统,组织相当于人体内部的各个器官,每个器官承担不同的作用,不同的器官先天条件决定人的天赋、性格;流程既是遍布行为全身的血管和神经系统,管理器官之间有效循环运作,又是人的行为思维模式,提升或约束人的行为效能;平台是人运用的工具,工具扩展了人各个器官的功能,辅助人行为方式的落实;场景是人行为切面,不同阶段或身份的人有其常规的行为,这些行为由人、工具、时间、协同、环境组成。流程在整个运维体系中,承担运维价值创造的具体实现,起来连接运维组织的人、财、物的各个节点,并沉淀组织最佳实践,指导组织日常的运作行为,平台及场景服务于流程的行为落实。流程是一个运维体系沉淀下来的资产,体现着运维组织在解决现实问题的智慧。

以下我总结一下运维流程的作用:

1.提升运维价值质量。流程能将经验、制度等隐性知识显性化,有助于建立方向有序的运维协作,实现个人能力向组织能力转变,提升运维质量的一致性,减少个体能力差异带来的风险隐患。

2.提高运维工作效率。有助于增加组织的有益产出,规范重复性或不明确的任务,减少非增值的活动,减少重复过去的失败,复制过去的成功,并利用运维平台化将员工从琐碎任务中释放出来。

3.加强运维组织管理。将对组织内经验驱动及自律性约束事项的任务进行抽象总结,沉淀为运维流程,流程线上化管理有助于组织对团队、人员、能力的管理,明确责任与义务,提升IT资源配置管理。

4.建立成长型组织。聚焦提升“业务连性保障、IT服务质量、交付效率、客户体验”的运维价值创造,持续吸收运维最佳实践并维护工作流程,形成方法套路。

3.1.2 哪些是运维流程

流程无处不在。流程不仅仅是事件、问题、变更、发布等,运维过程中到处是流程。流程管理大师哈默和钱皮认为流程是指成组的,相互联系,并为客户创造价值的活动。《牛津字典》对流程的解释是“流程是指一个或一系列、连续有规律的行动,这些行动以确定的方式发生或执行,导致特定的实现”。从这两个定义看,在运维工作过程中,有目标与达成目标的行为,并抽取出协同关系,有执行顺序都可以认为流程。下面我画了一张运维涉及流程的图.

从上图看,上面蓝色块是大部分运维组织都建立起的流程管理,这些流程在ITIL、ITSS、ISO20000都会有一些参考的最佳实践,容易“抽取出协同关系,有执行顺序”。通常结合这些最佳实践,在组织内制定相应的流程制度或规范,对最佳实践进行精简,适配,再结合系统自动化、线上化整合,能较快的落地。

而上图白色块的工作事项通常更多的是作为任务事项,很多组织缺乏抽取关系,标准化执行顺序。虽然上面的工作事项中,每个组织或多或少会沉淀下一些工作套路,但这些套路很多只是存在部分人头脑中,这就很容易出现同一个工作任务不同的人产生不同的输出,且沟通成本高。运维组织有必要重新思考日常习以为然的工作,以流程化的思维将这些工作进行标准化分解,采用先僵化,后优化,再固化的思路推动流程线上化、自动化,并借助线上化沉淀数据的运营分析,达到流程的持续优化。

3.1.3 建立持续优化的运维流程

未完成,待更新。

END。

注:本文为《数智万物下的运维》系列第3部分第3.1章的前两节,系列的其他内容目录参见公众号的菜单。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-01-11,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 运维之路 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档