【解读】关于数据中心可靠性和可用性的几个概念

导读:数据中心的重要性在于支持企业应用不间断运行,但近年来,世界各地的数据中心频频爆发安全故障事件,在一次次冲击着企业用户的心理防线。这也让我们产生一些思考,究竟该如何评判一个数据中心的优劣?

国内外数据中心的规范标准按照机房的性质和重要性将数据中心划分为以下不同的级别:

注:GB50174和TIA942并没有完全对应关系,本表仅为不同级别数据中心的对比。

这种级别的划分归根结底还是在可靠性和可用性上的划分,等级越高要求其可靠性和可用性就越高,其年平均故障时间就越短。因此我们评判数据中心优劣的标准可归结为:可靠性和可用性。

可靠性(Reliability)是一个概率值,指某个设备或系统在一个指定的时间内能够无故障的持续稳定运行的可能性。人们通常用MTBF(Mean Time Between Failure,平均无故障时间)这一指标来量化它。MTBF反映了产品的时间质量。可靠性是一个随时间变化的函数,时间越长,可靠性越低。其计算公式为:R(t)=e-λt,其中,λ为故障率,λ=1/MTBF.

可见,可靠性是一个与时间相关的标准,时间越长,可靠性越低。但是如果初始系统设计的较优秀,系统在更长时间内正常运行的概率就越高。由于数据中心中包含有各种各样的仪器和设备,不同的设备MTBF不尽相同,甚至是相同功能的设备MTBF也有所不同,所以对于数据中心的MTBF应该取所有设备MTBF的最小值。一些数据中心充分考虑了设备的业务备份,从而很大程度上避免了因设备故障造成业务中断的情况,所以MTBF的数值越高,就可以证明这个数据中心越好。对于MTBF不高的数据中心,依然可以通过其它数据备份、容错的方式提高其可靠性指标。其中容错是高可靠性的重要体现,当灾害或错误发生时,能够有自动修复和还原的作用,减少数据中心系统宕机率,确保系统的不间断运行。

可维护性(Serviceability)是指系统在规定环境条件下和规定的时间内,完成规定功能的能力,以及完成维护的容易程度。可维护性用MTTR指标来量化。MTTR(MeanTime To Repair,平均故障维修时间)是随机变量恢复时间的期望值,它包括确认失效发生所必需的时间以及维护所需要的时间。MTTR数值越小,说明数据中心故障恢复处理能力越强。数据中心出现各种故障是难免的,而MTTR数值越小的数据中心恢复业务的用时就越短,带来的损失也越小。

可用性(Availability)是指系统在使用过程中可以正常使用的时间与总时间之比,它是一个比率指标,其计算公式是A=MTBF/(MTBF+MTTR)。可用性可以用来表示某一运行中的可修复设备或系统在这段时间内能按其功能稳定运行的能力。例如:一个数据中心的MTBF是10年,MTTR是1小时,那么可用性指标A=10*365*24/(10*365*24+1)=0.9999772=99.9989%.在数据中心行业里,通过可用性指标的9数字的多少来表示数据中心可用性的高低。但可用性并不会特指故障发生的频率,对于相同的可用性,有以下数据:

通过可靠性和可用性这两个指标基本可以对一个数据中心有个整体综合评价,通过两个指标的对比也可以分出数据中心的好与差,是评价一个数据中心的根本。这使得数据中心基础设施的设计有了可量化的依据,也使得评估有了可量化的依据。

来源: 中国IDC圈

原文发布于微信公众号 - 钱塘大数据(qtbigdata)

原文发表时间:2016-08-24

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏王清培的专栏

软件工程—思考项目开发那些事(一)

阅读目录: 1.背景 2.项目管理,质量、度量、进度 3.软件开发是一种设计活动而不是建筑活动 4.快速开发(简单的系统结构与复杂的业务模型) 5.技术...

28510
来自专栏AI科技大本营的专栏

AI 技术讲座精选:无 IA(信息架构)不 AI(人工智能)

学习人工智能(AI)到底会如何影响我们个人生活和工作的各个方面? 利用人工智能技术的不同应用到底有哪些? 决策因素和具有典型应用、限制、考量因素和数据源的AI工...

31810
来自专栏云计算D1net

关于混合云,很多人都会有这些误解

云计算的兴起和任何趋势化的领域一样,都会不可避免地出现相当多的炒作以及混淆视听的噪声。 混合云自然也不例外,这导致人们对云的混合方法也产生了各种各样的误解。为了...

3346
来自专栏智能算法

新工具让 AI 在计算机上能做任何事儿,包括编程

OpenAI,一个非营利组织,致力于追求在AI的巨大进步,并让这种进步免费提供给任何人,已经发布了 Universe 平台。Universe 是一个通过实验和积...

4076
来自专栏大数据文摘

为什么大数据应用需要敏捷?敏捷大数据方法论

1844
来自专栏VRPinea

Unite ’16洛杉矶年度大会——Unity强势布局VR

3407
来自专栏杨建荣的学习笔记

dbaplus社群北京站沙龙归来

记得有一天林林问我们,北京是不是得办一场沙龙了,我说好,然后我们合计沙龙主题,我初步定了“数据架构和数据优化”,大家说好,然后沙龙的雏形就定了,我们很快挑选主题...

920
来自专栏SEO

「知识」语音搜索将是SEO新的挑战与机遇

36812
来自专栏云加头条

揭秘腾讯云Supermind智能网络,百万级设备的网络高效运维

网络数据中心正在不断向人工智能(AI)时代演进,在Gartner发布的《2017数据中心网络魔力象限报告》中,将分析和基于意图的网络(Analytics and...

7570
来自专栏腾讯社交用户体验设计

如何快速有效的发散思维

1253

扫码关注云+社区

领取腾讯云代金券