首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

【云顾问-混沌演练】“练”出强大,腾讯云混沌演练平台斩获三项优秀案例荣誉!

近日,在中国信通院组织的“首届云系统稳定安全运行优秀案例征集”活动中,腾讯云混沌演练平台斩获了三项优秀案例荣誉,包括混沌工程实践、云系统运行故障应急处置、变更管控领域。...由此,混沌平台应运而生。 组织上,成立混沌蓝军,依托腾讯云混沌演练平台,以第三方视角对所有云产品进行非通知的月度大规模实战演习,驱动各个产品达成容灾标准,最终促进达成0故障目标。...以腾讯云机房断电等重大故障演练实践为例,腾讯云混沌演练平台提供演练全生命周期管理功能,串联事前计划、事中演练、事后复盘等关键环节,从以下几个方面验证系统及应急预案的可用性: 1)云产品服务稳定性:故障注入以后...混沌工程平台能力评估 除了斩获三项优秀案例外,在中国信通院“2022下半年系统稳定性保障领域评估-混沌工程平台能力评估”中,腾讯云混沌演练平台(CFG)还凭借灵活、便捷、完善的故障演习功能和全面的安全防护保障能力...腾讯云混沌演练平台将持续完善自动化、可视化的混沌实验部署工具,探索致力于打造一个更完善的稳定性运营平台,满足企业在云迁移、云原生过程中的稳定性保障需求。

81550

新春:买域名送解析,域名续费享优惠!

/ .xyz/.love/.link/.art 新春价: 20元以下 特价 解析 DNS解析 专业版 新春价:  188元 /年 29元/年 DNS解析 企业版 新春价:  2680元...1999元起 购买入口 扫码直达DNSPod新春专场 买域名送 解析 买.cn 送解析专业版 新春价:  217元起 28.91元起 买.com 送解析专业版 新春价: 256元起 68...元起 买.top 送解析专业版 新春价:  197元起 9元起 买.xyz 送解析专业版 新春价:  206元起 18元起 域名 续费 .com续费 新春价:  75元/年 72元/年 .cn...续费 新春价:  38元/年 35元/年 .com.cn续费 新春价:  38元/年 35元/年 .top续费 新春价:  28元/年 25元/年 .xyz续费 新春价:  79元/年...75元/年 .net续费 新春价:  79元/年 75元/年 购买入口 扫码直达DNSPod新春专场

31.4K20
您找到你想要的搜索结果了吗?
是的
没有找到

鹅厂AI新春折扣有点猛!

模型如雨后春笋般涌现,并以惊人的速度和规模,重塑着我们对AI能力的认知。...腾讯云AI产品的新春采购节,正是我们对这一信念的践行。...本次新春,腾讯云智能精心挑选了一系列AI优品,从语音识别到语音合成,从AI绘画到数智人,从人脸核身到人脸特效,从文字识别到机器翻译,再到腾讯同传等,每一项技术产品都是我们对AI未来的深刻洞察和精心打磨...腾讯云新春AI会场特设两大专区: @首单专区:新用户购买,限购1次,最低0.4折! @特惠专区:不限新老用户,最低1.5折!...更多腾讯云AI产品新春折扣与活动详情可点击左下角 阅读原文 了解与采购下单!

12210

【云顾问-混沌演练】乐元素 x 腾讯云混沌演练平台:游戏业务同城双活改造最佳实践

演练实施 本次演练主要基于“腾讯云混沌演练平台(Chaotic Fault Generator)“进行。...3.1 创建演练任务 根据演练方案,在腾讯云混沌演练平台上提前创建演练任务,主要完成演练对象实例范围选取、故障场景动作的编排、添加业务稳态监控指标等。...目前平台提供100余种故障原子动作,支持用户在一次演练任务中对故障原子动作进行灵活的串行、并行组合编排,满足用户多样化的演练需求。 3.2 执行故障注入 通过混沌演练平台,执行故障注入操作。...借助自动化演练平台,提高演练效率 如果没有一个自动化的混沌演练平台,业务运维团队需要自主完成混沌实验设计,包括编写脚本、开发和测试注入工具,才能构建起一个复杂场景的故障模拟能力。...而腾讯云混沌演练平台就是一个面向用户提供全生命周期故障演练服务的自动化平台,它提供各个行业丰富的演练模板和100+故障原子动作,支持用户方便快捷地进行故障演练编排、自动化执行故障注入、观测监控指标、导出演练报告等

29420

Prometheus 新春| 你是如何走上人生巅峰的

你,一个美丽可爱的运维,在一个月黑风高的夜(傍)晚,接到了老板建立一个运维平台的需求.........接到任务的那一刻,你的内心是崩溃的,老板“很简单”的运维平台搭建需求,不仅仅要求业务,应用层,中间件,系统层的监控全覆盖,还要拥有告警和看板功能。...除此之外,结合腾讯云云存储服务及自身的副本能力,可靠性也是杠杠滴~ 更令你开心的是,正值腾讯云春季采购,作为新用户的你首月配置基础1套餐,价格低至3折!...也就是说,未来一年的运维平台顺畅运行,也可以通过这次大打下坚实基础。 看到活动只到3月31日便截止,心动的你立刻点击【阅读原文】详细了解了优惠折扣。...下单后,根据产品文档的指引,你顺利完成了运维平台的配置,从来没想过,构建使用和维护 Prometheus 平台,居然可以这么轻松!

12.5K40

中通大数据平台中的进化

一年一度的双十一又双叒叕来了,给技术人最好的礼物就是技术指南!...而经过这些年的发展,早已不仅仅局限于电商行业,现在各行各业其实都会采用类似方式做运营活动,汽车界有 818,电商有 618 、11.11 等等,各种各样的场景,对包括数据库在内的基础软件提出了很多新挑战...中,大家买买买后最期盼的事情就是收到快递。成立于 2002 年的中通快递,是一家以快递为主体,以国际、快运、云仓、商业、冷链、金融、智能、星联、传媒为辅的综合物流服务品牌。...对于企业而言,除了支持业务创新,也是一次对自身技术架构的练兵和全链路演练。通过大的极致考验,企业的 IT 架构、组织流程、人才技能都获得了大幅提升。...而在中的经验和思考,也会加速企业日常的业务创新节奏,提升技术驱动的创新效率,打造增长新引擎。

4.7K40

蚂蚁开源的云原生混沌工程平台 - ChaosMeta

ChaosMeta 是蚂蚁集团开源的一款云原生混沌工程平台。它凝聚了蚂蚁集团在公司级大规模红蓝攻防演练实践中多年积累的方法论、技术以及产品。...由“风险目录”(内部对各领域技术组件的通用风险场景手册)作为理论指导,结合技术实践,为蚂蚁集团多年的各种活动保驾护航。...为用户解放生产力的同时,也在追求着混沌工程的未来形态:一键自动化演练,甚至智能化演练。...平台功能强大,支撑完整“混沌工程生命周期”,面向自动化 ChaosMeta 覆盖准入检测、流量注入、故障注入、故障度量、故障恢复、恢复度量等多个阶段的平台能力,作为“自动化混沌工程”的技术基础。...可灵活搭配不同需求的演练平台

62510

|TakinTalks咖对谈

像业务层面就是更新了活动玩法,进行促销日常化,不会把的流量全部引到集中的时间点,例如双十一不会只是当天晚上开售,而是从 11 月 1 日就开始了,让流量均摊一些,那么保障压力也会减轻。...技术层面的话就会涉及到底层组件的产品化成熟问题,我们目前是已经有了压测平台,集成了几种压测方式。...把问题提前扼杀在摇篮里是最好的保障手段,混沌工程、故障演练开始进入大众视野,那它究竟是如何生效的?...混沌工程的重要环节就是故障演练,也是锻炼人和系统的主要手段。...至于规范的实际落地,我们往往会结合着平台工具来实现,更标准也方便检验回顾与更新迭代。 4. “安全生产”是业界新兴起的概念,对此有什么看法?

43420

【云顾问-混沌演练】欢乐互娱:新游上线混沌演练实践

为确保新游顺利上线,欢乐互娱与腾讯云混沌演练平台展开紧密合作,共同针对三核心业务场景的可用性进行了大规模容灾演练,最终保障了新游的顺利发行上线。...设计演练场景:在明确演练目标后,腾讯云混沌专家团队及高可用服务团队针对游戏行业通用故障痛点和业务特性,为业务定制化设计三故障模拟场景:接入层负载均衡容灾能力、逻辑层虚拟机容灾能力、数据层CDB容灾能力...在腾讯云混沌演练平台(CFG)上,业务团队可以轻松完成实例选取、演练场景动作编排、可视化故障注入和演练报告等全流程演练。...五、 腾讯云混沌演练平台 腾讯云混沌演练平台(Chaotic Fault Generator)是一款结合了腾讯内部实践的针对腾讯云上资源进行混沌工程实践的SaaS产品。...附: 公有云产品体验: 混沌演练平台-腾讯云产品控制台 故障演练操作指南: 腾讯云文档中心-混沌演练平台-故障动作库 案例介绍文档: 腾讯云文档中心-混沌体验营 高可用服务: 高可用服务 - 腾讯云客户支持

683110

思考:如何保证服务稳定性?

最近一直在忙618的全链路压测&稳定性保障相关工作,结果618还未开始,生产环境就出了几次生产故障,且大多都是和系统稳定性、性能相关的bad case。...下面是针对一些常见的稳定性专项的概述: 1、预案:分为定时预案和紧急预案,定时预案是常规操作对于一系列开关的编排,紧急预案是应对突发情况的特殊处理,都依赖于事前梳理; 2、预热:分为JIT代码预热和数据预热...,阿里内部有专门的一个产品负责这块,通过存储线上的常态化流量或者热点流量进行回放来提前预热,起源于某年双十一零点的毛刺问题,原因是访问了数据库的冷数据rt增高导致的一系列上层限流,现在预热已经成了之前的一个必要流程...2、混沌工程:混沌工程是近几年比较火的名词,通过不断给系统找麻烦来验证并完善系统能力,阿里在这块花了很大的精力建设红蓝军对抗攻防,进行定期和不定期的演练,最后以打分的形式来给各个部门系统做排名,除了系统层面的故障演练外还有资金演练...比如:ZK/ETCD编写的分布式锁;   3)峰值流量,如何防止外部ddos攻击?如何识别流量类型?   4)资源隔离:资源隔离,服务分组,流量隔离;   5)高可用思想:避免单点设计!

4.2K30

混沌工程在工商银行的探索实践 | Q推荐

二是系统底层部署架构复杂,涉及 IBM 机、PC 服务器、虚机、容器、物理机、国产化服务器、非标准服务器等多种类型的底层设施,随着主机下平台的推推进,很多原来运行在主机平台上的服务都需要逐步迁移至开放平台...由于工行目前正在进行 IT 架构转型转型,因此目前存在多种架构并存的情况、比如 IBM 机 COBOL+DB2 体系,IOE 体系,开放平台体系等。...总结一下就是混沌工程故障演练平台需具备通用、便捷、智能的特性。 混沌工程故障演练平台 基于通用、便捷、智能这三个理念,我们在 2019 年开发了混沌工程故障演练平台。...平台也负责所有故障演练的生命周期管理和结果分析。 最上面的就是业务场景,目前工行主要有三应用场景,最常用的就是平时的日常故障演练,用来检测各业务系统的鲁棒性。...有些应用觉得自己挺稳定的,为啥要弄一个混沌工程把自己的平台系统搞的不稳定,这不是没事找事么。所以不同的人对于这件事情的态度差异非常。我们的结论是,自底向上去推,是非常困难的。

86620

【云顾问-混沌演练】容灾演练Game Day最佳实践——moomoo

四、挑战与解决方案 挑战1: 演练涉及资源对象类型多、实例范围 此次演练涉及多个云产品的故障演练,如果采用传统人工运维支持的方式,需要协调各个基础产品团队配合实施故障注入,协同沟通成本较高; 解决方案...挑战2: 演练涉及对象实例多 本次演练为了模拟真实单可用区出现故障的场景,需要一次性完成最多数百台实例的故障注入,操作难度。...通过演练,客户更好地了解了服务的容灾能力和故障时系统切换流程,提高了对自身服务的信心。 六、混沌演练平台产品介绍 本次演练由客户在腾讯云混沌演练平台上操作完成,更凸显出了平台自动化的重要性。...腾讯云混沌演练平台(Chaotic Fault Generator)是腾讯云针推出的一款针对腾讯云上资源进行混沌工程实践的Saas产品,平台提供覆盖一站式故障演习服务: ● 演练前,平台提供演练计划功能...附: 公有云产品体验: 混沌演练平台-腾讯云产品控制台 故障演练操作指南: 腾讯云文档中心-混沌演练平台-故障动作库 案例介绍文档: 腾讯云文档中心-混沌体验营 高可用服务: 高可用服务 - 腾讯云客户支持

979142

给系统打针高可用疫苗,鹅的数据库就是稳!

除此之外,腾讯云MySQL还有一个杀器:支持现网模拟的故障演练。...接入混沌演练平台后可大幅提升MySQL的可用性和稳定性,帮助用户揭示和规避风险。...图:腾讯云MySQL产品控制台实例详情页--实例架构图 step2: 创建演练任务 1.点击进入「故障演练」入口后,可以看到腾讯云混沌演练平台演练场景介绍页: 混沌平台将自动代入待演练的云MySQL...图:腾讯云混沌演练平台--执行演练 故障执行成功之后,可在云数据库 MySQL 控制台 观测故障注入效果。...图:腾讯云混沌演练平台--行业演练模版 结语 腾讯云MySQL与混沌演练平台的紧密联动,旨在帮助用户及时发现数据库潜在的可用性问题,并提前采取措施消除风险,从而实现正确用云、可靠用云。

25820

Chaos Mesh® 在腾讯——腾讯互娱混沌工程实践

腾讯游戏混沌工程团队给出的答案是:把 PingCAP 开源的 Chaos Mesh 在腾讯云 TKE 落地,用以解决当前服务故障频率高、质量控制挑战的问题。...混沌工程的雏形就是故障演练,但是故障演练并不等于混沌工程,混沌工程是在故障演练的基础上扩展出来的新技术,主要体现在出现了专业的混沌工程工具,如 PingCAP 开源的 Chaos Mesh 等产品,以及相关理论体系的建立...最开始用混沌工程的时候,Chaos Mesh 有一些文档不是很完善,使用时甚至需要连蒙带猜。但是到了现在这个版本,文档已经非常丰富、非常全面,这一块他们感觉到进步非常的。...腾讯互娱混沌工程团队也是基于这个理论来实施建设混沌实验平台。 ?...混沌工程的优势就体现在:只需要把这些故障在平台上做简单的拖拉拽的编排,不需要要编写、调试脚本,就能下发实验并实时观测实验效果。故障演练这件事情的成本降低了,效率大大提高。 ?

89930

Chaos Mesh® 在腾讯——腾讯互娱混沌工程实践

腾讯游戏混沌工程团队给出的答案是:把 PingCAP 开源的 Chaos Mesh 在腾讯云 TKE 落地,用以解决当前服务故障频率高、质量控制挑战的问题。...混沌工程的雏形就是故障演练,但是故障演练并不等于混沌工程,混沌工程是在故障演练的基础上扩展出来的新技术,主要体现在出现了专业的混沌工程工具,如 PingCAP 开源的 Chaos Mesh 等产品,以及相关理论体系的建立...最开始用混沌工程的时候,Chaos Mesh 有一些文档不是很完善,使用时甚至需要连蒙带猜。但是到了现在这个版本,文档已经非常丰富、非常全面,这一块他们感觉到进步非常的。...腾讯互娱混沌工程团队也是基于这个理论来实施建设混沌实验平台。...混沌工程的优势就体现在:只需要把这些故障在平台上做简单的拖拉拽的编排,不需要要编写、调试脚本,就能下发实验并实时观测实验效果。 故障演练这件事情的成本降低了,效率大大提高。

1.3K20

【云顾问-混沌演练】精细演练,稳定云端——腾讯云助阵金蝶云,守护小微业务稳定高可用

改造完成后,业务团队通过腾讯云混沌演练平台进行故障注入,以检验业务系统的容灾效果,从而提升业务系统韧性。...本次演练主要针对金蝶小微业务线(精斗云&KIS云),涉及10业务故障场景,是财务、新零售、电商等领域行业提高系统可用性的一次最佳实践。...安全保障要求高:由于混沌实验涉及金蝶精斗云的关键业务和客户数据,为了保障现网客户不受影响,演练中要精准控制混沌爆炸半径,做好应急预案及时止损,这就对演练平台提出了更高的安全保障要求。...四、演练实施 创建演练任务 根据演练方案,在云顾问·混沌演练平台上提前创建演练任务,主要完成故障原子动作的编排,演练对象实例范围选取、添加稳态监控指标等。...执行故障注入 云顾问·混沌演练平台提供可视化视图,用户在演练过程中可以实时查看故障动作执行状态(成功/失败/执行中)和注入效果: 观测监控指标 在故障注入过程中,通过平台集成的监控面板,对演练对象实例监控指标进行观测

11810

混沌故障演练如何尽可能保障生产环境不被破坏

2.6、结合使用监控报警、日志排查等平台工具实时收集服务器在混沌演练运行期间的性能状态,错误信息,如系统层面的 CPU、内存等使用情况,观察方法的响应时间、成功率等指标,一方面验证在混沌场景执行期间系统状态是否达到预期的效果...三、以中移磐基CMChaos混沌平台生产环境落地过程予以分析讲解 首先,可以把故障分成五种类型:机房问题、中间件问题、机器问题、应用问题、依赖问题。...对企业来说,可以优先做机房层和中间件层,因为这些问题当中,中间件和基础设施出问题的概率较高,影响也。所以这里引出来一个点:混沌工程的实践路线到底应该怎么去落实。...当然,如果服务治理从来没出现过任何问题,这个可能价值就不会那么。...CMChaos混沌工程平台不仅仅是一种技术工具,更是一种管理工具,其核心目标是确保业务连续性。通过该平台,企业能够降低成本、提高效率,助力数字化转型实施,并为我国云计算产业高质量发展提供坚实技术保障。

38340

干货 | 通过不断地失败来避免失败,携程混沌工程实践

我们将这个方向结合混沌工程落地的5个原则(可参考《混沌工程:Netflix系统稳定性之道》),规划了混沌工程在携程落地的Roadmap。 ? 三、实践 在混沌工程的实践初期,我们开始建设故障演练平台。...这些场景可以抽象为五类:访问入口类、应用类、数据类、系统和网络等基础设施类。这些抽象的故障场景即为需要实现的故障注入能力。 ?...程序员们需要理解的是——不论是否实施混沌工程,系统的隐患或Bug 都客观存在。实验是使故障及早暴露在可控制的爆炸半径内,避免真实发生时影响生产业务。 其次是故障演练平台的成熟度。...在一个无时无刻不在变化的生产环境中,想要长期维持较高的可用性,必须常态化演练。而故障演练平台的易用性和成熟度是保证演练长期运转的基础。...随着混沌实验的深入,我们对故障演练平台做了升级,从初期的“覆盖尽可能多的故障场景”演变为“面向混沌实验的全过程”,最终演变为目前的CMonkey, 如图。 ? ?

87020
领券