首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

十一,阿里叒出问题了

阿里又挂了就在双十一热火朝天的进行时,阿里叒出问题了为什么说又,因为就在不久前,语雀就因为服务问题出现了故障,在8小时后才得以恢复。...但这次故障影响的范围较上次相比就大得多了,不但语雀出现了问题,淘宝、钉钉等APP均收到了影响,许多依赖阿里的产品也受到了影响。...“淘宝又崩了”“闲鱼崩了” “阿里盘崩了”“钉钉崩了” 等话题陆续登上热搜。知道的以为服务出现了问题,不知道的还以为马跑路了。...不久后阿里发布公告,确定了影响的范围大约在8点左右,服务陆续恢复不知道是否有了上次的经验,这次修复问题的速度快了很多。只用的三个小时就修复了问题。

473220
您找到你想要的搜索结果了吗?
是的
没有找到

顾问上架构运营工具介绍

,今天我们就调研下做的比较好的两款产品:腾讯顾问(Tencent Smart Advisor)和AWS的Well-Architected Framework,来看看两款的设计思路以及对大家的帮助,...顾问顾问是腾讯结合腾讯多年服务客户沉淀的最佳实践,一键完成资源的巡检操作,根据业务实际使用情况,在线提供资源优化建议,高效提升业务连续性。...部分风险巡检项示例:图片完整列表参考:顾问 风险评估-产品简介-文档中心-腾讯风险报告如下图:图片2.2 风险治理风险治理栏目,沿用了腾讯云海量运营的思路,通过dashboard来展示当前风险进展、...总结本文对比了两个上的架构运营工具,详细介绍了他们的组成部分、设计思路,从中可以看出来,腾讯顾问,更偏向于具体的实例风险及架构感知,可以及时感知故障修复情况;而aws的Well-Architected...实际使用时,可以把两个工具结合起来,Framework获取整体的实践,而顾问自动获取使用过程中的改进项。我正在参与2023腾讯技术创作特训营第二期有奖征文,瓜分万元奖池和键盘手表

20100

首次揭秘1112背后的数据库技术!| Q推荐

为了保证在这样的大促尖峰能够支撑逛的高并发,阿里在数据库的选择上经历了从开源 MySQL 到 AliSQL 的迭代。...Tair 近几年深耕的持久内存技术很好匹配了当今众多的类似场景,也就是在上正在售卖的 Tair 持久内存形态(Tair-PMEM)。...在陈锦赋看来,原生数据仓库 ADB3.0 很大的一个价值部分在于能够实现数据的在线化实时化,能够挖掘到一些目前还未被发现到的商业价值。...2021 年是阿里巴巴首个上 100% 上 11 的一年,也是阿里数据库全面原生化的一年,但是峰值计算成本相比 2020 年下降了 50%,数据库巨大的商业价值和潜力可见一斑。...原生数据库未来的优势和带来的价值,也将超过数据库本身。

31.6K50

顾问-混沌演练】乐元素 x 腾讯混沌演练平台:游戏业务同城活改造最佳实践

为了给用户提供更稳定可靠的使用体验,在2023年Q2开始,乐元素运维、业务团队联合腾讯售后专家和技术专家,基于针对乐元素旗下休闲游戏产品《开心消消乐》展开同城活改造项目,目的是了解并改善业务容灾部署状况...,进一步强化上业务系统的容灾能力。...业务容灾部署状况与挑战 l 要求故障时快速恢复:客户业务服务全量部署在TKE环境,跨区部署改造后,需验证在单个可用区宕机的情况下,业务Pod和各存储组件各存储组件能否及时调度到另一个可用区,路由流量是否能响应并路由到健康可用区中...在此次演练之前,乐元素已经对业务架构部署进行了全面优化,不仅完成了线上环境的全面容器化升级,还完成了活改造,以确保系统在任一可用区或链路发生故障时,均具备可快速恢复的应急预案。...客户收益 乐元素在本次同城活演练中,成功应对了一系列关键业务的容灾挑战,并对系统的整体可用性和可靠性进行了全面验证,达到演练目标。在此次演练中,客户主要取得了以下两方面收益: 1.

26820

如何选择合适的计算顾问

他们不了解计算,对于应该如何将工作负载正确迁移到计算有着错误的想法。 其他顾问一样,计算顾问也必须非常适合企业的业务。以下是为企业选择最佳计算顾问的指南。 ?...随着计算的应用越来越广泛,企业对计算顾问有着越来越多的需求。无论是内部部署数据中心还是公共,其市场都有巨大的增长。...5)合规性和敏锐性 - 将个人和敏感数据迁移到计算有很多规则,企业的计算顾问必须知道这些规则。...8)证明成功 – 需要询问计算顾问的业绩记录,并与他们的客户进行沟通和交流。现在计算的技术与应用日益成熟,企业不应该成为任何人的试验品,所以需要与在企业所在行业的经验丰富的顾问进行合作。...如果计算顾问不能满足企业的要求,企业可能需要重新选择其他的计算顾问。 11)供应链 - 在评估咨询合作伙伴时,需要了解他们在服务提供者的供应链上的排名。

2.2K81

顾问-混沌】腾讯上容灾实践

在2023年11月12日,刚经过11的购物节大压力的阿里,却从17:44起发生了服务宕机,旗下的淘宝、闲鱼、饿了么等服务出现服务中断,甚至让高校学生宿舍的洗衣机都“宕机”了。...从阿里健康看板公布的数据可以看出,阿里的几乎所有的产品等服务都受到了影响,影响了全球范围内多个地域。阿里这次故障,放在整个厂商界都是炸裂般的存在。阿里历时3个多小时,服务才陆续恢复。...11 受影响产品 : 企业级分布式应用服务、消息队列 MQ、微服务引擎、链路追踪、应用高可用服务、应用实时监控服务、Prometheus监控服务、消息服务、消息队列Kafka版、机器学习、图像搜索、智能推荐...、数据库 MySQL 版、原生数据仓库AnalyticDB MySQL版、原生分布式数据库 PolarDB-X、数据库 ClickHouse、原生多模数据库Lindorm、数据库 PostgreSQL...、视觉智能开放平台、智能外呼机器人、智能语音交互、智能对话机器人、智能用户增长、运维事件中心、新零售智能助理、智能录质检、地址标准化、机器翻译、自然语言处理、短信服务、解析DNS、域名、号码认证服务

44171

顾问-混沌】混沌工程理念:起源

如何开展混沌工程实验 腾讯混沌演练平台(CFG),为您提供安全、易用的的故障注入服务,助您打造稳固如磐石的架构系统。...无论您是独立开发者、运维工程师还是安全专家,腾讯混沌演练平台都是您不可或缺的利器: 我们拥有丰富的故障动作库,能够模拟IaaS、PaaS、SaaS近百种故障注入场景,可视化的动作编排,让小白也能快速入门...,轻松上手构建一个复杂场景的故障演练任务; 更值得一提的是,腾讯混沌演练平台还拥有行业演练经验库。...你了解你的上服务的稳定性边界吗?还在为上稳定性而忧虑吗? 马上免费试用腾讯混沌演练平台,体验一场真实的混沌工程实验吧!...点击链接,立即了解更多关于腾讯混沌演练平台的信息,一起开启稳定性建设的新篇章!

23140

顾问-混沌】Redis故障演练-主从切换

腾讯混沌工程实践 Redis 集群是业务存储热数据的重要组件,为保证业务的可用性,依靠集群内节点之间的 Gossip 协议来进行节点状态的判断,默认的心跳超时时间 (cluster-node-timeout...如果此故障节点为主节点时,腾讯Redis将采取故障切换机制,将重新从备节点选举新的主节点。...腾讯混沌演练平台基于以上特性,提供手动方式跨过节点故障阶段直接模拟HA策略的故障动作,您可通过该手动故障方式模拟当 Redis 集群发生故障切换机制的短时间内对业务的影响。...优先同可用区切换 模拟主节点发生故障时,腾讯Redis真实HA策略场景:数据最新节点优先提主;数据相同时,优先同可用区其他节点选举 2.

20110

顾问:跨过程中让架构“活”起来

除了完全原生的工作负载部署之外,如何做好业务迁移上的各阶段工作、自建服务与上服务联动、工作负载的跨部署等均会成为企业在各个场景下需要面对的“跨必答题”。...顾问在企业“跨”场景中也能够很好地提供帮助。首先,其架构强大灵活的架构图绘制能力、简约的2D/3D架构图呈现、可支持业务负责人清晰还原下的基础架构设计呈现。...其次,在顾问架构中,对部署在腾讯上的资源可以直接在架构图中进行“绑定”操作,让上的架构图“活”起来。...有了活的架构图,进一步便可应用顾问的垂直应用,发挥出更多的上架构治理能力。通过巡检应用及时巡检发现用隐患,聚焦上架构各节点的高风险、中风险进行及时的治理,提升上服务的稳定性。...顾问架构以及各大垂直应用的能力,还有待您进一步的发掘利用,为您的架构和业务保驾护航。

10500

顾问-混沌】 跨 AZ 容灾混沌演练

背景 随着计算技术的快速发展,越来越多的企业和组织将其业务迁移到平台,以实现更高效、灵活和可扩展的资源管理。...腾讯基于该背景,推出了混沌演练平台,助力用户进行上稳定性治理,并结合行业经验,形成了跨 AZ 的容灾演练模版,用户可以基于该模版一键创建混沌演练或在此模版基础上添加新的故障演练场景,灵活便捷!...跨 AZ 容灾 它是指在一个服务商的多个可用区之间进行业务和数据备份、恢复和迁移的能力。...借助于腾讯混沌演练平台,可方便快捷地进行跨 AZ 容灾混沌演练时,可以遵循以下步骤: 前往腾讯混沌演练平台【概览】选择「跨可用区容灾演练」行业经验模版。...选择对应的上实例资源或添加其他故障场景,即可开始跨可用区容灾混沌演练。

15910

顾问-混沌演练】迎难而上,腾讯混沌工程实践之道揭秘

来自腾讯的周峰以“腾讯混沌工程实践“为主题在上午场进行分享,来自腾讯的周永飞参与了下午场的“系统稳定性保障“圆桌讨论。...一、规模持续提升,稳定性面临挑战 随着数字经济转型逐步深化,众多企业正迈入全面上阶段。然而,计算架构所带来的复杂性也让稳定性面临极大挑战。...伴随着计算规模的快速增长,服务作为社会基础设施的重要性也日益提升。腾讯深知质量乃生命线,稳定性至关重要且不容忽视。 为了应对稳定性挑战,团队对产生这些问题的主要因素进行了深入剖析。...以下为本次会议的摘要内容: 圆桌会议——时代的稳定性挑战|混沌工程|SRE 来自腾讯高可用专家团队的周永飞参与“稳保行动·深圳站沙龙”下午场的圆桌会议,共同探讨了时代服务和商应用的稳定性挑战,...摘要: 时代的稳定性挑战:时代带来稳定性挑战涉及服务提供商和客户两方面。厂商面临多AZ、多region、全球化部署带来的网络环境、基础设施升级和软件版本发布等不稳定因素。

876110

顾问-健康看板】腾讯健康看板(Status Page)简介

简介腾讯健康看板(Status Page)已于2023年在腾讯官网全面上线,为用户提供腾讯产品在全球各区域的健康状态和可用性相关的信息,方便用户及时关注或在需要的时候进行回溯查询。...同时也作为顾问的原生垂直应用,将账户级的健康状态信息与架构图进行实时关联可视化展示和推送,助力企业更好管理上架构与资源,打造“上心安”的卓越架构。...国内国际同步已同步上线腾讯国内站和国际站,所有健康状态信息同步发布,保障全球客户及时获取所需信息。...产品架构产品可用性实时监测产品实时监测自身服务可用性,通过事件总线将异常事件信息投递到腾讯健康看板。及时准确腾讯健康看板将通过准确性校验后的可用性事件及时展现到官网页面。...系列文章腾讯Status Page(健康看板)前端部署实践腾讯Status Page(健康看板)服务端渲染实践腾讯Status Page(健康看板)容灾设计与混沌演练实践——上篇腾讯Status

15510
领券