首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

我们怎样借助混沌工程技术增强分布式系统?

投资于这种连续性可以加快产品开发的速度

这涉及专门致力于使状态系统可靠且一致,一致和有状态的服务是一堆最可怕的事情,因为它们有很多隐藏的依赖关系和可能会打破的假设,并且很难用混乱的工程技术进行测试,当您拥有存储数据的服务时,情况甚至更糟。但是她发现,混乱工程是保持状态,稳定性和理智性的最佳解决方案之一。

混沌工程第1步:量化可靠性

每当您尝试关闭系统时,都可能会关闭系统,这意味着您需要知道在将其推向工程师或客户之前可以推多远,我们正在努力实现一定程度的可靠性,以满足客户的期望,同时仍然允许我们进行创新,您的混乱之旅始于定义“可靠性”对您的系统意味着什么,了解什么是“足够好”,什么是“太坏了”,以及如何衡量服务质量,如果系统运行非常非常非常可靠,并且超出了我们的可靠性目标,那么我们需要在什么时候花时间并投资错误预算或允许的停机时间,以便探索潜在的故障案例?

将服务水平协议定位为客户,产品经理和工程师之间的通用语言

这些工程师列出了客户想要达到的目标以及如何衡量它,在这里您可以将所有计划映射中提出的目标水平,您首先要测量数据点内部“可实现的”可靠性这不是100%的可靠性,由于可观察性完全取决于客户的数据,关键指标很明确,我们只存储一次来的遥测数据,因此我们的客户一直在向我们尖叫数据,因此我们决定要吸收99.99%的事件。

cpda数据分析师

混沌工程的主题定义是敏捷性的核心:创建安全的环境

混沌工程第2步:设计实验、工程是一门科学,而混沌工程则利用了我们在小学中学到的科学方法、观察:这正在发生、问题是:如果发生这种情况怎么办?创建一个假设:如果发生这种情况,那么将会发生进行实验、观察更多、做决定、再试一次,直到达到期望的结果、您的实验应考虑所有这些步骤。

我们设计实验来证明风险,以验证我们的假设并验证我们正在使用的弹性技术将在生产中保持稳定

这并不是那么简单,她认为数据持久性“确实非常棘手”才能成功存储,尤其是在存在大量活动部件的系统中,这些更改非常非常少见,而且很难测试,因为它们并不是每天都在锻炼。

1、如果其中之一意外重启,会发生什么?

2、即使确实重新启动,您如何验证数据完整性和一致性?

3、如果一台计算机重新启动会怎样?

4、他们的单点故障在哪里?

扰流板警报:我们发现了一些问题,但是由于遗留了错误预算,所以我们能够进行生产实验

该团队通过在一个环境中一次仅重新启动一个来启动实验,然后他们观察变化。发生了什么?稳态有什么变化吗?

混沌工程第二步:修正发现的问题

这是您通过解决任何风险并解决发现的问题来关闭反馈循环的时候,然后再次执行实验,可观察性确实使您能够了解未曾预料到的事情,这正是我们希望通过混乱的工程实验来验证和验证的本质,在五到十分钟内停止向任何内部客户发送警报,他们观察到,他们的流程依靠领导者的选举来运行这些蜂窝警报的一个副本,以确保他们正在测量的所有内容(遥测)运行正常。如果发生故障,则遥测应该同意它发生故障,您的遥测可能会告诉我们一切都很好,如果不合适的话。

混沌工程第三步:重复

所以您修好了事就完成了,对吗?好吧,该修复程序可能会触发其他中断。也许根本没有解决。混沌工程学要求您应该重复实验,以确保一切均按预期方式进行,重复实验是使团队朝着生存中断迈进新台阶的方法,您执行混乱的工程越多,您对系统将能够承受诸如节点掉落之类的事情的信心就越大,通过混乱的工程发现了系统灵活性和节省资金之间的直接关系。现在他们知道自己的节点可以按需重新启动,因此可以采用可抢占的实例,他们不需要对这些实例性能执行主动的混乱工程,因为他们现在知道如何执行。

混沌工程法则:这是白天的团队努力

渐进式交付的技术文化现象的某些方面使开发团队在奇数小时进行渐进式部署,以影响较小或较不重要的客户群体,混沌工程不是其中之一,不要在周末进行混乱的实验,我们的想法是,bug浅一些,眼睛多,所以让我们确保所有双手都在甲板上,让我们确保我们能够尽快恢复实验,参与的人员越多,就越容易找到系统漏洞背后的原因。这也是关于最小化影响,更多的人帮助发现错误,意味着更少的可怕后果。

对我们来说,混乱工程的真正关键是要限制爆炸半径

对我们认为将要发生的事情做出假设,并一次只重启一个服务器或服务,团队可以继续根据他们进行评估,并查看他们是否有更多的错误预算来扩展其混乱的工程设计,这反过来又应该增加其系统的弹性。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20201010A092DC00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券