前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >SRE|系统管理员模式

SRE|系统管理员模式

作者头像
heidsoft
发布2020-09-29 11:04:31
9460
发布2020-09-29 11:04:31
举报
文章被收录于专栏:云计算与大数据

系统管理员负责将现成的软件组建部署到生产环境,对外提供某种业务服务。系统管理员对主要工作在于应对系统中产生对各种需要人工干预对事件,以及来业务部门对变更需求。

随着系统变得越来越复杂,组建越来越多,用户流量不断上升,相关的事件和变更需求也会越来越多。于是企业需要招聘更多的系统管理员,来应对日益增多的事件。

系统管理员的日常工作与研发(开发)工程师相差甚远。通常分属两个不通的部门:开发部门(Dev)和运维部(Ops)

度量风险

基于时间的可用性计算公式

可用性=系统正常运行时间/(系统正常运行时间+停机时间)

解释:计算出一年内可接受的停机时间,从而可以使可用性达预期目标,举例来说,一个可用性目标为99.99%的系统最多在一年中停机52.56分钟,就可以达到预计的可用性目标:

基于合计的可用性计算公式

可用性=成功请求数/总的请求数

解释:基于滚动窗口计算出来的(一天内成功请求的比率),例如一个每天可用性目标为99.99%的系统,一天接受2.5M个请求,它每天出现少于250个错误即可达到预计的可用性目标

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-09-24,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 云数智圈 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 度量风险
    • 基于时间的可用性计算公式
      • 基于合计的可用性计算公式
      领券
      问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档