首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

通信系统的异常情况有哪些

     新冠疫情已经流行了3年,对人类世界的运行造成了深深的影响,而在此之前,我们人类没有预料新冠疫情会持续这么久会对我们的世界造成这样的影响。

     虽然新冠疫情具有不可预料性,但在历史的时间长河中,各种小概率的意外事件持续发生,除疫情之外,还有各种天灾人祸,例如地震、海啸、火山喷发、森林大火等等。也正是因为这种异常情况常有发生,有人对其进行了研究并加以利用,写出了《反脆弱》。

     通信系统也如此,也需要反脆弱。考察通信系统的稳定性,更重要地是考察它在异常情况下的表现。那么,通信系统的异常情况有哪些呢?

     先说硬件方面。常见的,例如服务器故障、硬盘损坏、电源故障、接触不良等等,这一类异常情况最为直观,也容易被理解&处理。

     再说软件方面。像软件BUG、性能问题、兼容性问题、同步问题、容错性设计、构架设计、安全性问题等,软件问题应该是通信系统异常情况的最主要部分,特别的,一些问题具有很强的隐蔽性及复杂性,处理极为棘手。

     运行环境也是一个重要方面。例如断网断电,发生自然灾害等。运行环境的异常情况处理,一般是事前通过容灾备份负荷分担的方式来处理,但真正的考验主要在事中的处置及事后的善后处理,运行环境恢复后,确保通信系统保持正常运行并且数据不出现差错,特别是对用户无感知,颇为不易。

    实际上,人为破坏也是通信系统的出现异常的常见因素。例如,运维操作不规范、升级错误、删库跑路等等,在通信历史上都有发生。而要解决这类异常情况,除系统技术手段外,更重要的是建立完善的管理制度及监督执行;而这类事情一旦发生,破坏性往往极强,所以,一个重要的思路是,假设这种事情必然发生,如何将损失降低到最小。

    上医治未病,不发生问题的系统,让人感知不到问题的系统才是好系统。那么,这里就离不开通信系统的预警机制:及时的发现问题并处置,在问题萌芽时即将异常消灭于无形,可极大提高系统稳定性。

     下医治已病,我们熟知并认可的名医往往是治已病的下医,而对治未病的上医不闻不问;类似的,问题没有发生时,我们容易忽略系统异常情况的处置价值并降低投入,而这,往往就会埋下隐患的种子,以至于“病入膏肓”。

      所以,对于通信系统,我们既要了解常见的异常情况,也要树立正确的理念,根据业务场景确定目标&衡量投入,才能把握通信系统的稳定性,满足经营需要。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20220412A028FO00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券