数字经济全面启航 同创永益混沌工程平台助力企业扬帆远行

近年来,中国数字经济发展逐步提速,各行业企业纷纷加入数字化阵营,新业态发展势头强劲。数字技术已经深社会经济的各个领域,引领生产、消费迈向数据智能、人机协同的创新发展阶段。与此同时,企业数字化发展过程中,也将面临着因业务系统复杂所带来的稳定性挑战。

日前,同创永益联合道客共同发布混沌工程故障演练平台,平台可通过在生产环境中执行探索性测试以发现系统中的隐藏问题,配合使用可观测性平台、容量管理、全链路压测等工具或技术,组合搭建系统稳定性保障体系,全方位保障系统可用性,确保企业数字化转型顺利推进。

拥抱数字化 企业系统稳定性有待提升

企业在数字化转型中拥抱云计算、大数据等新技术的同时,系统架构复杂度越来越高、调用链路越来越长、依赖关系越来越多。日益复杂的 IT 系统与快速迭代的软件交付为系统稳定性的保障带来更多挑战和不确定性,国内软件系统稳定性仍有较大提升空间。

例如疫情期间,各地与疫情相关的大数据系统都经受着严峻挑战,系统前期建设中考虑不足之处逐渐暴露,多地健康码都出现了“崩溃”现象,无论原因是操作不当还是网络攻击,其结果都严重影响了市民的正常生活,甚至影响到国家整体的防疫部署工作。

近年来,诸如此类由于系统问题导致的软件服务无法使用情况屡见不鲜,对企业发展乃至社会民生都造成了不同程度的影响。

中国信通院发布的《中国混沌工程调查报告》显示,目前国内25.89%的服务每个月发生超过 5 个严重性事故,意味着约 1/4 的产品每年会发生至少 60 次严重性事故。近20%的受访用户所负责的产品可用性低于2个9(意味着用户每个月要忍受超过7.3小时的服务故障),超过4成产品的可用性低于3个9(意味着用户每个月要忍受超过44分钟的服务故障)。

此外,故障发生之后的解决情况也差强人意:仅不到一半的用户故障平均发现时长(MTTD)小于1小时;故障平均修复时长普遍超过1小时,超6成故障修复时间(MTTR)高于1小时,甚至有约20% 的服务故障修复时间超过12小时。

混沌工程 数字时代系统“稳定器”

数字信息时代,如何才能避免系统故障的发生呢?如果说100%避免并不现实,但当下最能够提升系统稳定性的手段,那当属混沌工程。

混沌工程是一种类似于疫苗保护人体的方式,通过主动向系统中引入软件或硬件的异常状态,制造故障场景并根据系统在各种压力下的行为表现确定优化策略的一种系统稳定性保障手段。应用混沌工程可以对系统抵抗扰动并保持正常运作的能力进行校验和评估,提前识别未知隐患并进行修复,进而保障系统更好地抵御生产环境中的失控条件,提升整体稳定性。

《中国混沌工程调查报告》的另一项调查数据显示,从未使用过混沌工程的受访者中,有近三成受访者产品可用性低于99%,而随着混沌工程使用频率提升,在每天都会演练的受访者中,这一比例急剧缩减到 2.5%,即随着混沌工程使用频率提升,低可用性的产品占比急剧萎缩;与此相对应的是,从未使用过混沌工程的受访者中,仅25%的产品可用性高于99.99%,而随着混沌工程使用频率提升,在每天都会演练的受访者中,这一比例迅速增长至65%,即随着混沌工程使用频率提升,高可用性的产品占比迅速增长。

相信,随着混沌工程技术与产品的逐步普及与应用,越来越多的企业将对系统稳定性更有信心,这对企业数字化的良性发展起到了至关重要的作用。

2022年是中国数字经济发展的重要一年,“加快数字化发展建设数字中国”的数字化战略被第一次被写进了“十四五”规划中。中国数字经济的前进与企业数字化发展密不可分,企业如何利用好数字技术平台,拥抱数字化转型,从而促进企业高质量发展,是值得深思的问题。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20220629A04VLC00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码关注腾讯云开发者

领取腾讯云代金券