首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

云原生混沌工程 - 增强Kubernetes应用容错性

不管在将软件投入生产之前进行多么困难的测试以发现错误,错误总是会发生 - 云和可用区域会出现问题,网络会崩溃,是的,错误会让人感觉它们的存在。容错性(Resilience/弹性)是指一个系统承受这些错误的能力 - 例如,一个高度容错性的系统,一个由松散耦合的微服务构建的系统,它本身可以很容易地重新启动和扩展,在不影响用户的情况下克服这些错误。混沌工程是在系统出现故障之前,将其注入系统的实践。混沌工程现在被认为是确保当今频繁变化和高度复杂的系统实现所需的容错性的基本方法。通过混沌工程,可以在引起用户问题之前发现和纠正未预料到的故障场景。

01

国内首个《中国混沌工程调查报告》深度解读来了!(附下载链接)

随着分布式、云原生成为主流的系统架构设计方案,大规模分布式系统的稳定性保障能力越来越成为业界关注的重点。如今,混沌工程作为保障系统稳定性的利器,受到业界广泛关注,中国信通院作为国内最早推进混沌工程标准化工作的单位,联合混沌工程实验室全体成员单位、社区、媒体共同发起国内首个混沌工程问卷调查,以期掌握我国混沌工程的接纳程度和特点。   本报告采用在线调查加线下访谈的方式,共回收有效问卷 1016 份、访谈企业 17 家。报告的第一部分介绍调查背景,第二部分介绍我国混沌工程当前使用情况,第三部分是混沌工程致力于提

02

FreeWheel核心业务团队混沌工程实践之路

近来 FreeWheel 微服务业务团队的业务逐渐扩大,单体服务已经无法胜任,于是我们如火如荼地开展了向微服务迁移的工作,一时间,服务如雨后春笋般冒了出来。在享受微服务带来便利的同时,我们也面临着众多服务带来的整体稳定性的考验。尽管我们有着完善的监控和报警系统,一旦故障发生,总是能第一时间通知到工程师来排查问题,但是这些都是事后的响应和应对。如何能提前了解系统可能会出啥问题,啥时候会出问题,出了问题怎么应对变得至关重要。混沌工程是帮助解决这一问题的不二选择,本文主要聊一下 FreeWheel 微服务业务团队在混沌工程道路上的实践。

02

混沌工程实践

一个系统的复杂性往往是无法预知的,而且这种状态是很难琢磨,因为任何的系统总是在确定性的状态下存在一种不可预知的非确定性,这样的案例可以说是有很多的,比如XX城市的X系统由于网络故障导致系统不可用,可以说这样的案例太多。所以针对每个系统而言都是存在稳定状态和不稳定状态,很说明确的说混沌与不确定性是一回事。其实在系统的边界而言,或者是从系统最初设计以及保障角度而言,混沌状态它首先代表的是系统是处于一个稳定性的状态,只是系统在运行的过程中由于局部技术问题以及可能存在的全局技术问题导致系统出现不稳定的状态,虽然我们很清楚这种现状是客观存在并且可能是无法改变的,但是作为技术团队,需要站在系统的高可用,可靠性,稳定性等等角度,需要最大寻求系统的确定性以及让系统的运行始终在可以掌控的范围内。混沌工程的核心需要解决的是模拟现实中可能会出现的不可预知的情况以及本身客观存在的情况,比如网络故障,云服务器大面积出现瘫痪等情况了,那么在这种情况发生后,如何能够使用成熟的技术方案保障产品的可用性以及保存数据的完整性,而不至于在现实中真的出现该问题的时候表现的束手无策。

02
领券