首页
学习
活动
专区
圈层
工具
发布

指标数据运维流程

一. 现状

针对目前大数据异常响应效率低,解决处理定位难,运维压力集中在某几个人等不合理的现状。经过大家沟通讨论会商量和整理,目前初步的TODO和流程说明如下:

  1. 针对响应效率低,引入学习监督机制,确保问题没人管,问题在拖延出现。 监督人是业务方面谁开发谁是责任人,异常谁发现谁主动报备,组件主要负责人沟通协作三方面展开;
  2. 针对业务方向,输出指标列表说明,涵盖指标的业务线,任务,调度参数简单化,详细说明到非业务开发负责人都能够进行协助处理,任务恢复和重跑;同时争取某个业务不能只有一个开发同事承接,希望业务内容可以交叉。
  3. 针对技术组件方向,建立大数据技术保障组,异常谁发现谁报备到保障组并@组件负责人,组件负责人根据实际情况,业务重要程度,是否发起团队能力协助处理来主要负责处理。

二. 异常处理和响应流程总览

三. 异常奖励机制,待完善

事项

积分

异常报备

1

异常讨论,提供异常解决内容

1

异常关键信息,如果最终异常解决是这部分内容

3

异常处理,谁解决谁立功

5

      每月总结查看文档记录和积分情况,对排名靠前的进行实质性的奖励。

下一篇
举报
领券