专栏首页用户7261497的专栏服务器可靠性:一个9的差距究竟有多大?

服务器可靠性:一个9的差距究竟有多大?

服务器可靠性:一个9的差距究竟有多大?

说到关键业务系统的可靠性,经常用到所谓4个9或者5个9,也就是99.99%与99.999%。那么,4个9或者5个9的差距有多大,差距是0.009%,还不到0.01%。但对于系统而言,恰恰是这不到0.01%的差距,决定了系统完全不在一个档次上。下面小编赵一八笔记给大家说说服务器一个9的差距究竟有多大?

所谓5个9的系统,一年内不能正常工作的时间少于5分15秒。对应4个9的系统是不超过52分36秒。这些都是理论上的数据,在实际工作中有些故障导致的宕机时间远超过5分钟,即使采用大型主机,也有宕机4个多小时的惨痛教训。

问题出在哪里?

一个系统的可靠性并不完全取决于硬件,而由软件和硬件共同来决定,如果是软件问题,最好的解决办法就是打补丁、升级,再好的硬件也没有办法解决软件的问题。要提高系统的可靠性,软件是没有太好办法的,只有依靠厂商服务来解决问题。用户可以选择的只有硬件,其中,包括网络、服务器以及存储设备。其中,网络可以借助多运营商接入来解决,存储有RAID、快照等应对技术,通过备份来提高数据安全性。但对于服务器来说,更多用户的选择是采用双机集群的方法。

采用双机集群的方案是达不到5个9的要求的。原因很简单,双机集群是通过集群软件来构建方案的,当其中的一台服务器产生故障的时候,切换到备份主机继续工作,保持业务连续性。设备之间也可以依靠心跳线连接对故障进行判定。对于集群而言,故障切换是有严格要求的,要求主机、备用机的环境是一致的。在应用实践中,要求管理要到位,例如同步升级、升级,打补丁。如果管理不到位,很有可能会导致切换失败。这也是为什么,系统可以在演示环境下成功切换,但现实中往往做不到的原因。

即便是管理到位,双机集群也没有办法做到无缝切换,也就是业务不停顿的切换。因为备用主机没有办法同步主机内存、I/O中的数据,一旦主机突发故障,这些数据没有办法在备机中同步,因此也没有办法实现不停机的切换。因此,双机系统切换是需要时间的。

对于用户而言,双机系统的价值在于及时恢复系统,重建应用。一旦切换不成功,系统恢复需要较长的时间;如果是集群软件的原因,就需要集群软件厂商的技术人员来解决问题。因此,双机集群方案对于用户的管理水平和技术水平有很高的要求。

要实现故障的无缝切换,容错服务器几乎是惟一的方案。容错服务器不能够解决软件的问题,但可以解决硬件系统的问题,因为处理器、内存、I/O在每一个计算机时钟周期内的每一个操作,全部是同步的,也就是通过“锁步技术”来保持一致性,对结果进行比对,比对一致才会判定成功,否则需要从新计算。但其中一部分硬件产生故障时,系统失去容错,进入单机运行状态,待更换故障部件之后,重新进入容错流程。因此,采用容错可以彻底克服突发性硬件故障,避免业务中断。

与小型机、大型机等具有高可靠性的产品相比,采用容错方案构建的系统,其高可靠性不是来自容错服务器产品,不是来自产品不出错,而是通过特殊的体系架构应对故障的发生。对于小型机、大型机而言,如果也采用容错结构,那么系统的可靠性要跨上一个新的台阶,但成本代价不是一般用户可以承受的。

原文链接:http://www.fuwuqidl.com

相关文章

  • 小米模式,国产手机厂商学不会

    现在手机厂商分两种:小米,非小米。 前者的“互联网思维”正在被煎饼和牛腩们复制,虽然谁也说不清互联网思维究竟是啥。 手机厂商也有效仿的,华为便...

    罗超频道
  • 计算所山世光:AI方法论需升级,疫后 AI 将如何发展?

    曾被誉为人工智能的三驾马车——算法、算力、数据,到了需要反思的时刻。特别是深度学习在学术前沿的后续发展乏力,恐难支撑AI能力继续升级。

    AI科技评论
  • 【专访微软黄学东】0.1%,0.2%与0.3%,语音识别军备竞赛中小数点差距有何意义

    【新智元导读】 微软语音识别研究团队在黄学东的带领下,去年将语音识别的单词错误率降至5.9%,又在最近降至5.1%。在本次专访中,我们讨论了语音识别错误率百分之...

    新智元
  • 电力巡检机器人哪家强?全国半数都是山东造?

    自2005年第一台变电站智能巡检机器人在济南投运以来,已经在全国765所变电站推广应用了近500台,市场占有率保持在全国第一,占据国内市场半壁江山。 在不少企业...

    机器人网
  • 最新计算机技能需求排名出炉:Python仅排第三,第一你猜得到吗?

    为了研究这件事,美国招聘网站 Indeed 做了一项调查,统计了 2014 年到 2019 年五年间发布在自己网站上的数百万个美国地区的岗位数据,这些岗位共包含...

    磐创AI
  • 2019 最新计算机技能排名出炉:Python 排第三,第一名是...

    为了研究这件事,美国招聘网站 Indeed 做了一项调查,统计了 2014 年到 2019 年五年间发布在自己网站上的数百万个美国地区的岗位数据,这些岗位共包含...

    GitHubDaily
  • 2019 最新计算机技能排名出炉:Python 排第三,第一名是...

    为了研究这件事,美国招聘网站 Indeed 做了一项调查,统计了 2014 年到 2019 年五年间发布在自己网站上的数百万个美国地区的岗位数据,这些岗位共包含...

    用户6543014
  • 计算机技能需求新排名:Python 仅排第 3,第 1 竟是常常被嫌弃的它……

    最近,来自美国招聘网站 Indeed 的一份报告显示:在全美工作技能需求中,数据库语言 SQL、编程语言 Java 分列前两位。虽然 Python 和 AWS ...

    数据森麟
  • 重新定义SaaS销售,跨越收入增长鸿沟

    ? 来源:ToBeSaaS|作者:戴珂 ---- 腾讯SaaS加速器 三期40席项目招募 报名方式 腾讯SaaS加速器,作为腾讯产业加速器的重要组成部分,旨在...

    腾讯SaaS加速器
  • 最新计算机技能需求排名出炉:Python仅排第三,第一你猜得到吗?

    除了编程语言之外,要想找一份计算机相关的工作,还需要很多其他方面的技能。最近,来自美国求职公司 Indeed 的一份报告显示:在全美工作技能需求中,数据库语言 ...

    机器之心
  • 为什么一些优秀的java框架都是外国人写的,为什么国内的程序员大部分只会搬砖?

    作为一个写了十几年代码的程序员,平时用的比较多的有三种编程语言,C/C++ java,相对来讲C/C++爱的更加深刻一点,国内普遍一个现象拿到的源码基本上都是国...

    程序员互动联盟
  • 你的系统可用性 5 个 9 了吗?

    又是一年放榜日,众多考生满怀期待的点开招生网,结果输了信息才发现根本没办法查询——查询人数太多了,直接把系统打挂了!这个时候,还没翻身的码农闰土被问到一个直击心...

    出其东门
  • 解放我们的双手与大脑,全自动驾驶汽车,究竟离我们还有多远

    解放我们的双手与大脑,全自动驾驶汽车,究竟离我们还有多远 明年,还是十年?全自动驾驶汽车离我们究竟还有多远。 ? 基本上每周都会有来自汽车制造商、供应商,甚至专...

    企鹅号小编
  • 集团ERP研究:实施能力国产厂商有优势 SAP并非无懈可击

    产品实施是ERP行业一直以来避讳的话题,无论售前讲的天花乱坠,最终实施才是见真章的时候,考验产品质量、团队技术能力、实施人员专业度和灵活度在这一环节高下立见,许...

    人称T客
  • 通信专业校招的三个常见误区

    市场岗位,紧密围绕产品、服务及解决方案,花钱在各种渠道搞营销(例如展会、宣讲、活动),吸引关注,让用户、合伙伙伴感知到自家产品及方案的优势。

    鲜枣课堂
  • Gartner:亚马逊的云计算优势或很快终结

    Gartner那帮信奉大名鼎鼎的Magic Quadrant(魔术象限)的先生们手握宝贝计算器,又一次走出昏暗的书房宣布亚马逊是云计算的真主,不过他们补充说,亚...

    静一
  • 亚马逊云计算霸主地位或将动摇

    Gartner那帮信奉大名鼎鼎的Magic Quadrant(魔术象限)的先生们手握宝贝计算器,又一次走出昏暗的书房宣布亚马逊是云计算的真主,不过他们补充说,亚...

    静一
  • “北斗”背后的GNSS技术,到底是个啥?

    2020年6月23日9点43分,我国在西昌卫星发射中心成功发射了北斗系统第五十五颗导航卫星,也是北斗三号的最后一颗全球组网卫星。至此,北斗三号全球卫星导航系统星...

    鲜枣课堂
  • 分析:Inmarsat是如何追踪MH370的(为什么马当局未见残骸就得出坠毁结论)

    3月24日北京/吉隆坡时间晚上10点,马来西亚突然召开新闻发布会,其总理纳吉布宣布,根据新的数字分析,MH370航班在南印度洋坠毁。最终位置在印度洋的中央,在珀...

    CDA数据分析师

扫码关注云+社区

领取腾讯云代金券