12月3日,由全球数字经济大会组委会主办、中国信息通信研究院和中国通信企业协会承办的“云·AI·计算国际合作论坛”在北京召开。论坛以“智起云端,算绘蓝图”为主题,围绕云·AI·计算产业发展、关键技术、最佳实践等方面展开了全面的交流讨论。大会期间正式发布了2024年下半年可信AI云评估结果,其中在AI Cloud Stability评估方向上,Tencent TCS演练平台产品成功通过《可信云混沌工程平台能力要求》测评,并荣获先进级认可。
信通院的《可信云混沌工程平台能力要求》标准,依据混沌工程理念,针对平台系统软件的综合稳定性技术水平以及混沌工程演练的管理工具进行了详细定义。该标准不仅提供了一个阶梯式的建设框架,还明确了构建混沌工程平台工具所需具备的能力和支持的场景,从而推动混沌工程平台能力逐步迈向成熟。
Tencent TCS不仅参与了该标准的制定,其演练平台产品在本次评测中更是在基础设施能力、平台功能、平台性能、支撑能力等4大类、13个小项中全部通过,完全符合专有云混沌工程平台的能力要求,达到了业界领先水平。
Tencent TCS演练平台是一款基于混沌工程方法论设计的产品,通过注入各种模拟的异常来验证业务系统的稳定性,同时找到业务系统的弱点,从而帮助用户提高业务健壮性。演练平台构造的异常场景基于多种经验库实现,经验库包括可用性演练、性能压力演练、安全性演练等类型,涉及到资源类、应用类等。用户通过对经验库进行编排来实现演练,编排内容包括配置经验库、选择注入异常的演练对象和选择监控项。启动演练后系统会自动完成演练,演练结束后,可以通过监控系统展示演练过程中代表业务稳态的指标变化,用户可以根据指标变化分析业务健壮性的影响因素。
Tencent TCS演练平台具备以下优势:
● 支持多平台:支持腾讯云与非腾讯云演练,在硬件架构上同时适配了X86和国产化架构。
● 丰富的场景和演练方案:预置丰富的原子能力,支持自定义故障;内置200+的演练场景,与环境解耦开箱即用;支持可视化编排演练流程。
● 可靠的安全防护策略:提供多维度防护策略,包括资源、应用、集群级别目标域控制,按AZ级别、主从角色选择实例注入故障。以及支持自定义终止策略与业务功能检查测试。
● 丰富的生态服务:提供一键导出演练报告能力,提供资源管理、监控、告警、日志服务等一站式解决方案。
腾讯专有云演练平台已在腾讯内部的财付通应用生产环境,以及众多金融行业客户的生产环境中,作为日常的演练工具,帮助识别基础设施及数字化业务在高可用运维设计上的风险与漏洞,并提供修复支持,是助力企业级用户持续提升自身平台及业务稳定性能力的攻坚利器。