首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

压测探索实践之路

去年双十一,为了应对零点的峰值流量冲击,我们在八月下旬启动了全压测第一次实践。由于从零开始,因此单独搭建了一套和生产1:1的环境,2个月的时间,光环境成本就高达几百万。...经过双十一,压测团队从中汲取了不少的经验和教训。双十一之后,在CTO的指导下和支持下,由基架和性能测试团队快速的投入了全压测平台的研发当中。...并且趁着核心系统重构,快速的接入落地,对后续的系统稳定性保障工作,迈出了坚定地一步。 流程导图 ? 梳理阶段 1、系统服务梳理 全压测是一个很复杂的工程,其中涉及到多个服务。...3、外部服务关闭 由于全压测的特殊性,因此在压测开始前,都会对外部服务进行服务注册下线,保证压测的流量不会影响生产业务。...5、网络隔离检查 同样,由于环境的特殊性,压测前需要对各服务的隔离情况进行确认,避免影响生产业务。 实施阶段 1、单机单接口基准 单机单接口的基准压测是必不可少的环节。

84510

压测第一次实践

我司在双十一来临的最后关口完成了整个核心的全压测, 大幅提高了核心服务性能,并发布了最终优化版本。...挑战一:核心梳理 电商业务本身比较复杂,且当前阶段我们微服务架构下,各个服务间依赖高,调用关系复杂,且没有较为清晰的梳理,理论上来说,只有一部分系统才是核心。...主要是如下几项: 前端:降级点确认、容错保护、监控数据接入; 后端:核心梳理、监控&服务保护接入、专项预案、 测试:资源准备、压测模型梳理、压测方案、全压测、预案演练、线上功能验证; 基础架构:...架构优化、网关替换、DB垂直拆分、基础设施接入追踪、监控、报警......); 资源保障:容量规划、镜像环境搭建、服务部署联调、线上扩容; 2、估时排期 确认任务规划后,各个技术团队迅速组织协调资源投入了各自的工作...在服务治理这一项,基础架构的同学接入了sentinel进行相关管理。

3K40
您找到你想要的搜索结果了吗?
是的
没有找到

腾讯云海外直播系统架构是怎么设计的?

这时候我们要保证这一整条服务质量,状态一定要准;状态同步过去之后还要保证回源的问题性,在核心路上去铺设回源专线,现在跨区回源都走腾讯云的内网专线。...去年有一个海外第二大电商,他们去年在双十一、双十二用直播答题的项目进行引流。在双十一、双十二期间拉流服务超过2千万次,带宽500多G峰值带宽。...我们根据监控找服务应用商,后找我们的团队去优化,这种基础服务能力要保障。...海外弱网环境的处理思路 第一,上行优化和下行优化都在IDC之间传输,你可以自己采购,在巴西也有公有云的服务,你去监控发现它每天到美国的都或多或少会丢包,有些是持续性的丢包...A:我们采购的运营商他们自建的跨大区的物理提供给我们的服务,是一种MPLS-V**技术,并且打了金牌标签的优质。在腾讯内部的网络体系里面我们认为它就叫专线。

9.6K40

胡仁成:腾讯视频云海外直播系统架构设计与最佳实践

这时候我们要保证这一整条服务质量,状态一定要准;状态同步过去之后还要保证回源的问题性,在核心路上去铺设回源专线,现在跨区回源都走腾讯云的内网专线。...去年有一个海外第二大电商,他们去年在双十一、双十二用直播答题的项目进行引流。在双十一、双十二期间拉流服务超过2千万次,带宽500多G峰值带宽。...我们根据监控找服务应用商,后找我们的团队去优化,这种基础服务能力要保障。...第一,上行优化和下行优化都在IDC之间传输,你可以自己采购,在巴西也有公有云的服务,你去监控发现它每天到美国的都或多或少会丢包,有些是持续性的丢包。...A:我们采购的运营商他们自建的跨大区的物理提供给我们的服务,是一种MPLS-V**技术,并且打了金牌标签的优质。在腾讯内部的网络体系里面我们认为它就叫专线。

4.5K50

海量之道系列文章之弱联网优化 (六)

因为系统级的推送体系也必须维持一个自己的,而这个路上要承载五花八门的APP推送数据,如果太重,一方面会在设计上陷入个性化需求的繁琐细节中,另外一方面也会造成这条的拥堵和性能延迟。...④ 断点续传 一方面,在讨论链路管理时,我们建议了优质网络下的并发来完成同一个重数据拉取任务。这就会涉及到任务的拆分和并行执行,基础是后台能支持断点续传。...,建立的数量和时间成本就都增加了; 2) 异步并发请求的能力,HTTP协议最早的设计中,在拉取多个资源时,会对应并发多个HTTP(HTTP/1.1的Pipeline类似)时,服务端无法区分客户端请求的优先级...,减少创建和数据往复,提升网络效能。...建设云端可控的接入调度(比如接入IP列表等)和网络参数(比如连接超时、IO超时、任务超时、并发链接数、重试间隔、重试次数等)配置下发能力; 5) 服务器根据汇总数据,通过数据分析,结合服务器自身的监控机制

1.7K00

阿里财报:菜鸟外部收入占比提升至73%

全国8万多家菜鸟驿站提供送货上门 围绕消费者的服务体验升级,菜鸟着力加强配送能力和末端网络建设,通过多种手段提升送货上门的服务履约。...继服务天猫超市、天猫食品重货送货上门之后,菜鸟自营配送接入了天猫国际,开始把进口保税商品送货上门。...通过菜鸟城配网络,品牌不仅可以实现供应的线上订单管理,还能为大型线下商超卖场、主要商圈的品牌专柜供货补货。...今年双十一期间,菜鸟日均大件家装收货量、签收量同比增长均超过500%,品质物流服务成为消费者下单购买的重要决策因子之一。...凭借突出的全球物流能力,本季度菜鸟还与元气森林、花西子多家国货品牌和跨境企业合作,为其提供定制化的端到端全物流解决方案,优化其物流时效及服务体验。

36920

凌锐蓝信正式推出睿智通SD-WAN云融合骨干网接入服务

本文主要介绍凌锐蓝信SD-WAN云融合骨干网接入服务的实际用户价值与运行机理。 骨干网接入服务并不新鲜,都是再传统不过的网络服务。而睿智通云骨干接入服务,其中包含两个新概念:SD-WAN,云融合。...使用睿智通云骨干接入,企业只需要在云端部署vCPE,接入骨干网,即可完成Office和云的互通 满足企业快速跨云需求。您不仅能想快速上谁家云就上,还能想跨哪家云就随意跨。...不仅如此,除了传统的线路冗余方案之外,还包括允许应用程序根据拥塞或路径条件自动从一个切换到另一个,上述切换可快速完成,并从单节点部署到整个企业网络。...通过“GUI管理界面”的控制平台,您可对网络中的设备和进行抽象和虚拟化,形成统一网络资源池来实现全局视角的管理和控制。 只需点击一下鼠标,即可快速变更多个节点的设置。...云POP之间有互联网,也有多条专线互联,而睿智通SD-WAN便可以根据业务SLA设定转发策略,将各捆绑成为虚拟带宽资源池,随时动态调用这些线路与各云VPC互联互通(图3绿色虚线框)。

1.2K20

备战2018双十一,电商平台需要什么“黑科技”?

网络营销的普及让许多商家尝到了互联网的甜头。领取优惠券、赠送礼品等手段为商家带来了更多用户和更高营收,但同时也催生了营销场景下的网络黑产。...曾有业内人士大致测算,中国电信网络黑产从业人员已经超过150万,市场规模达到千亿元级别。 每年的双十一,更是“羊毛党”攫取利益的最佳时机。据统计,2017“双11”全网总销售额达2539.7亿元。...根据腾讯云分析发现,电商平台中的黑产分析已经形成了有组织的团伙作案和一定规模的合作:在黑产的上游,开发者、打码平台和服务器供应商提供软件开发和技术支持;中游环节由机器批量注册账号和分销;下游环节通过刷点击量...在专业工具的加持下,这场本来是电商平台和用户的“剁手”狂欢已演变成了黑产的狂欢,“行情,一天可以赚两三万,月入百万也不是不可能”。...(图:电商平台接入天御后,羊毛群讨论难以刷券) 此外,全方位多层次的安全防御体系不仅能够打击营销场景下的欺诈行为,还能打击视频、电商及出行等行业的虚假流量、恶意刷量行为,节省客户的营销支出。

5.7K30

蚂蚁云原生应用运行时的探索和实践 - ArchSummit 上海

主要的里程碑就是: 2017 年底开始技术预研 Service Mesh 技术,并确定为未来发展方向; 2018 年初开始 Golang 自研 Sidecar MOSN 并开源,主要支持 RPC 在双十一小范围试点...; 2019 年 618,新增 Message Mesh 和 DB Mesh 的形态,覆盖若干核心,支撑 618 大促; 2019 年双十一,覆盖了所有大促核心几百个应用,支撑当时的双十一大促;...2020 年双十一,全站超过 80% 的在线应用接入了 Mesh 化,整套 Mesh 体系也具备了 2 个月从能力开发到全站升级完成的能力。...从 Service Mesh 到 Multi-Mesh:蚂蚁最早的场景是 Service Mesh,MOSN 通过网络连接代理的方式进行了流量拦截,其它的中间件都是通过原始的 SDK 与服务端进行交互。...例如 RPC 的 RPC 协议,消息的 MQ 协议,缓存的 Redis 协议。然后现在的 MOSN 其实也不仅仅是面向流量了,例如配置就是暴露了一下 API 给业务代码去使用。 ?

73040

一文了解电商大促系统的高可用保障思路-献给技术伙伴们

双十一&双十二: 双十一是指各网络购物平台在每年11月11日的大型促销活动,最早起源于中国阿里巴巴旗下购物网站在2009年11月11日举办的“淘宝商城促销日”,现已演变成全行业一年一度的购物活动,及影响全球零售业的消费现象...2012年11月11日网络购物全日销售额超过美国网路星期一,成为全球最大的互联网的购物节日。双十一购物节战场延伸进12月,即“双十二”。...;从电商平台大促目的来说,大促活动更多的是希望带来交易订单的达成,促进交易额的提升,所以整个交易是真正目标核心,属于整个大促活动的最重要环节;从仓储、配送、售后来看更多的是交易后履约服务保障,这里面更多的是给电商平台带来的口碑影响...因为涉及业务知识比较庞大,以下简要说明下作为大家一个参考(欢迎大家讨论) 营销:营销策略方案制定->营销方案采销/商家宣讲->营销方案外部市场公关->营销活动创建->营销活动审核->营销活动投放...超时 超时JIMDB组件 其他应用/中间件/数据库:会发现很多时间我们的问题引入集中在三方因素较多,也是在备战中需要关注的重点: •- 接口定义不合理,业务周知不到位,新上的业务需求直接在某个时刻脉冲流量到达薄弱依赖将服务打挂

34820

ZLJ卖场-全压测演进

什么是全压测 当接手ZLJ卖场所有业务性能测试后,重新调整性能测试流程和规范,每个项目进行登记,不再是单一接口压测,都需要制定对应的压测场景,后续在双十一、双十二大促的时候,也把全压测场景补充进来...介入全压测的时机 在可以预期的一段时间(如双十一、双十二),业务会有较快速的发展,线上机器必须要大幅度扩容 机器扩容以倍数增长,评估机器性能是否翻倍 继续扩容后,服务能力不一定翻倍增长,有可能会受限于其他的依赖关系...梳理 是一个业务的核心,根据业务特性要快速梳理清楚 梳理,难点在于服务依赖的边界 示例:首页-》商列 首页跳转到商列,商列服务又会查询商品相关服务数据商列-》第三方服务(简称S) 商列除了查询商品相关服务数据...而双十二大促压测有了双十一大促压测作为基础,核心问题提前规避和检查,在全压测过程中除了存在部分服务cpu占用100%问题和缓存问题,影响核心业务的性能问题基本上没有出现,有的只是边缘业务问题,不影响主业务流程...对于双十一、双十二这类大促活动,全压测必然是保障核心业务稳定性的保障手段之一。 end

2.3K10

蚂蚁云原生应用运行时的探索和实践

主要的里程碑就是: 2017 年底开始技术预研 Service Mesh 技术,并确定为未来发展方向; 2018 年初开始 Golang 自研 Sidecar MOSN 并开源,主要支持 RPC 在双十一小范围试点...; 2019 年 618,新增 Message Mesh 和 DB Mesh 的形态,覆盖若干核心,支撑 618 大促; 2019 年双十一,覆盖了所有大促核心几百个应用,支撑当时的双十一大促;...2020 年双十一,全站超过 80% 的在线应用接入了 Mesh 化,整套 Mesh 体系也具备了 2 个月从能力开发到全站升级完成的能力。...从 Service Mesh 到 Multi-Mesh:蚂蚁最早的场景是 Service Mesh,MOSN 通过网络连接代理的方式进行了流量拦截,其它的中间件都是通过原始的 SDK 与服务端进行交互。...例如 RPC 的 RPC 协议,消息的 MQ 协议,缓存的 Redis 协议。然后现在的 MOSN 其实也不仅仅是面向流量了,例如配置就是暴露了一下 API 给业务代码去使用。

59710

压测如何排障调优 — 先导篇

【什么是全压测】 在网络上对全的名词解释,可以看到相关词条里有很多延伸:全监控, 全设计,全追踪系,全运营,全日志分析......基于以上的分析,我们给全压测的定义:基于实际的生产业务场景、系统环境,模拟海量的用户请求和数据对整个业务进行压力测试,并持续调优的过程。...模拟海量的用户请求和数据:海量的目的是让服务器能够达到较大的负荷,从而达到压测的目的。海量数据一般来源于线上数据引流或者真实数据模拟。...整个业务:要求压测需要覆盖整个业务,诸如CDN到接入层、前端应用、后端服务、缓存、存储、中间件整个等。如果压测的请求只能覆盖部分的,不称为全压测。...以阿里为例,如果在双十一的凌晨12点发生故障,分分钟就损失了好几亿。 image.png 3.排障非常难,我们之前遇到一个问题,排查了八九个通宵才有进展。

2K271

【面试题】消息堆积解决方案

作者简介: 大家,我是CBeann,CSDN博客专家,阿里云专家博主。 22届校招进入阿里广告部门从事Java开发工程师。...平时有空会帮大家解决问题,模式面试和日常答疑,并且提供免费云服务器使用。 有一起卷的可以加我的微信:CHAI956056312,大家一起学习,一起进步。...文章目录 1、背景 2、解决方案 2.1、加机器 2.2、继续加机器 2.3、多线程 2.4、多线程-顺序消费 3、案例拓展 1、背景 临近双十一了,产品找到开发的同学帮忙把某些广告主的广告投放时间延长两个月并重新送审风控审核...整个的demo如下图所示。 中间件监控如下图所示 2、解决方案 2.1、加机器 一开始以为偶尔出现的一波流量,加一台机器看看。所以整个如下图所示。机器总数小于分区总数。...记录日志,人工接入。 3、案例拓展 大盘监控:完善的监控报警方案,早发现早治疗,别等用户反馈。老板喜欢看大盘。 变更通知:操作前一定要周知上下游,包括异步

35610

双 11 的狂欢,干了这碗「流量防控」汤

阿里人喜欢将双十一视为 Team Building(团队建设),广为流传的一句话:打仗是最好的团建,没有参加过双十一的叫同事,参加过双十一的叫战友。...比如 A 服务调用 B 服务,由于网络问题或 B 服务宕机了或 B 服务的处理时间长,导致请求的时间超长,如果在一定时间内多次出现这种情况,就可以直接将 B 断路了(A 不再请求B)。...获取信号量 线程池隔离和信号量的场景对比 线程池隔离技术 ,适合大部分场景,但需要设置服务的超时时间。 信号量隔离技术 ,适合内部比较复杂的业务,不涉及网络请求问题。...支撑阿里的双十一核心场景,如秒杀、消息削峰填谷、集群流量控制、实时熔断下游不可用。 完备的实时监控。 可以看到接入应用的单台机器秒级数据,以及集群的汇总情况。 广泛的开源生态。...根据调用入口限流:限流。 根据具有关系的资源流量限流:关联流量限流。

64110

流量防控该如何选型?

临近双十一,从 2009 年第一届双十一开始,成交量只有 5000 万,到去年 2019 年,成交量达到了 2684 亿。今年迎来了第十二届双十一,想想都挺激动。...比如 A 服务调用 B 服务,由于网络问题或 B 服务宕机了或 B 服务的处理时间长,导致请求的时间超长,如果在一定时间内多次出现这种情况,就可以直接将 B 断路了(A 不再请求B)。...线程池隔离和信号量的场景对比 线程池隔离技术 ,适合大部分场景,但需要设置服务的超时时间。 信号量隔离技术 ,适合内部比较复杂的业务,不涉及网络请求问题。...支撑阿里的双十一核心场景,如秒杀、消息削峰填谷、集群流量控制、实时熔断下游不可用。 完备的实时监控。 可以看到接入应用的单台机器秒级数据,以及集群的汇总情况。 广泛的开源生态。...根据调用入口限流:限流。 根据具有关系的资源流量限流:关联流量限流。

1.1K32

压测(6):确认范围和识别风险

流程图如下: 如上述2张图所示,以电商双十一大促举例说明。...3、识别核心 目前互联网行业大多是微服务这种分布式系统架构,服务之间的内部互相调用关系很复杂,一般会借用追踪工具来识别他们的调用关系以及调用频次,以此来判断哪些是核心,以及他们的强弱依赖关系...核心任务拆解,可以参考下面这张思维导图: 2、依赖风险 前面提到了强弱依赖,最核心的原因在于:生产全压测甚至是应对双十一流量峰值的场景,需要准备很多的稳定性预案,常见的有限流降级熔断甚至主备切换和容灾恢复等...3、环境风险 全压测,无论是在单独的性能测试环境进行单机单接口、单机单、单机混合压测,还是在生产进行压测,对环境的要求是比较高的,特别是生产环境,需要考虑的更多。...如流量路由的组件接入情况、mock准备、影子表、数据准备、预热甚至监控的覆盖度,都是会影响到环境的因素。

70310

天猫双11订单峰值58.3万笔秒,消费狂欢背后隐藏了哪些技术?

不断增长的订单数据背后,今年的消费体验也出现了很多变化,付款不再卡顿、快递速度极快… 盛大的消费狂欢过去后,来盘点一下,阿里什么技术撑住了双十一?...在视觉 AI 领域,拍立淘目前支持 4 亿商品对应的图片和视频检索;自然语言学习(NLP)、实时机器翻译、语义识别等技术,也在店小蜜、实时翻译、商品评价分析等关键使用。...再配合「犀牛制造」,阿里便可以打造真正全、规模化的柔性制造案例。 在供应端,直播等新的消费形态改变了用户整个消费行为,对供应提出更高的要求,而供应的数字化能够帮助商家智能备货、极速履约。...阿里今年搭起了直播全协同平台,数据智能贯穿在从商品供给到仓配决策到末端解决方案全过程。帮助商家三分钟释放库存、接住直播中突发交易单、做损益测算,也可以直接赋能商家通过直播品来提升 GMV 成交。...最后,2020 双十一的科技感可以总结为以下十大前沿技术: 「2020 双十一」十大前沿技术 Amazon SageMaker实战教程(视频回顾) Amazon SageMaker 是一项完全托管的服务

8.2K10

没有 “流量防控”,还玩什么双11

比如 A 服务调用 B 服务,由于网络问题或 B 服务宕机了或 B 服务的处理时间长,导致请求的时间超长,如果在一定时间内多次出现这种情况,就可以直接将 B 断路了(A 不再请求B)。...获取信号量 线程池隔离和信号量的场景对比 线程池隔离技术 ,适合大部分场景,但需要设置服务的超时时间。 信号量隔离技术 ,适合内部比较复杂的业务,不涉及网络请求问题。...支撑阿里的双十一核心场景,如秒杀、消息削峰填谷、集群流量控制、实时熔断下游不可用。 完备的实时监控。 可以看到接入应用的单台机器秒级数据,以及集群的汇总情况。 广泛的开源生态。...Spring Cloud、Dubbo、gRPC 都可以接入 Sentinel。 完善的 SPI 扩展点。 实现扩展接口来快速定制逻辑。 一张图来总结: ?...根据调用入口限流:限流。 根据具有关系的资源流量限流:关联流量限流。

2.1K20

压测二十问干货汇总 (上)

通过全压测可以在正式切换前完全解决性能问题;配合自动化的例梳理和人工验证,可以极大程度降低业务故障。两者配合使用,可以快速的渡过不稳定期,提升用户体验。...4.如何确定业务核心的边界 如何确定业务核心一直是全压测前期准备工作的核心,这里需要注意的是:核心是指在精力有限的情况下,必须要保障,意味着需要投入更多的硬件资源、更多的工程师、...全压测监控体系是由基础监控,应用监控、业务监控三部分构成。 7.1 基础监控 是指压测产品或者压测应用系统的集群基础性能监控,比如 CPU 性能、磁盘性能、网络性能等。...10.压测中如何调用部分或第三方外部服务?...10.2 外调压测 外调压测是指压测中涉及到调用其他供应商提供的系统,比如第三方支付或者一些短信服务之类的,如果第三方愿意配合,我们就按照正常压测去进行就 ok,但一般情况下第三方不太愿意配合

85200
领券