前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >故障定责的“责”是什么责?

故障定责的“责”是什么责?

作者头像
赵成
发布2022-04-21 16:12:42
2630
发布2022-04-21 16:12:42
举报
文章被收录于专栏:Forrest随想录Forrest随想录

上篇文章《故障没有根因,别再找了》提到了定责与根因挂钩,其中有一段:

“如果我们还把根因跟定责定性挂钩,不用我说,大家也能想象到,无尽的撕逼扯皮和甩锅推诿就该开始了,好好的氛围就会变得阳奉阴违,多做多错最后就是不做不错。

没想到这段话得到了更多朋友的共鸣,转发和留言中都有人重点提到这个点。

所以能明显感觉到,大家苦故障久矣,苦的不是根因,苦的是定责,是定责过程中的撕逼扯皮和推诿甩锅,甚至是人身攻击。

其实遇到这种情况,我也见怪不怪了,一般认怂,没必要过多的争辩,尽快领了自己该改进的事项,尽早结束没有意义的争论。

因为这个事情本质上还是个文化和氛围的问题,这个不是单独某个人或团队能改变的。

不过改变不了什么,不代表咱就能躺平了,不思考也不改进,这个就太消极了。

改变不了,我们可以尝试影响嘛,比如多写点类似的文章,表达下自己的观点。

我还是强调换个角度看问题,针对定责这个事情,我的观点很鲜明:

故障定责的责,一定是改进的责,而不是指责的责。

最近,最近社区交流了解到,现在国内已经有大厂取消了P2及以下故障的定责到人的机制,只定到团队,纳入团队稳定性考核分,P1会到人,一般也是到团队管理者。

换句话说,管理者要承担更大的故障责任,而且故障中受影响的团队都会承担责任,只是主要还是次要的区别,跟上篇文章的方式类似,同时,不会因为你是被影响方就不会被考核到,就是希望大家都从自身找原因,别总想着往外甩。


前面聊了两期Observability,其中的Tracing部分一直没有详细分析过,正好博文视点刚出了一本的关于分布式链路跟踪的专业书籍,讲的还不错。

上次送过之后,又要找侠少要了三本。

大家可以关注我的公众号之后,回复“Tracing”,获取送书方式。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2022-04-20,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 聊聊SRE 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档