系统管理员负责将现成的软件组建部署到生产环境,对外提供某种业务服务。系统管理员对主要工作在于应对系统中产生对各种需要人工干预对事件,以及来业务部门对变更需求。
随着系统变得越来越复杂,组建越来越多,用户流量不断上升,相关的事件和变更需求也会越来越多。于是企业需要招聘更多的系统管理员,来应对日益增多的事件。
系统管理员的日常工作与研发(开发)工程师相差甚远。通常分属两个不通的部门:开发部门(Dev)和运维部(Ops)
可用性=系统正常运行时间/(系统正常运行时间+停机时间)
解释:计算出一年内可接受的停机时间,从而可以使可用性达预期目标,举例来说,一个可用性目标为99.99%的系统最多在一年中停机52.56分钟,就可以达到预计的可用性目标:
可用性=成功请求数/总的请求数
解释:基于滚动窗口计算出来的(一天内成功请求的比率),例如一个每天可用性目标为99.99%的系统,一天接受2.5M个请求,它每天出现少于250个错误即可达到预计的可用性目标