首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

记5.28的性能优化—线程池相关问题

目录: 1.环境介绍 2.症状 3.诊断 4.结论 5.解决 6.对比java实现 废话就不多说了,本文分享下博主在5.28期间解决的一个性能问题,觉得这个还是比较有意思的,值得总结拿出来分享下...每次业务方进行期间平台都要进行一次常规压,做到心里有底。 在压的上半场,陆续的解决一些不是太奇怪的问题,定位到问题时间都在计划内。下单服务、查单服务、结算页都顺利压通过。...但是到了支付回调服务压的时候,有个奇怪的问题出现了。 1.环境介绍 我们每年基本两次大,5.28、双12。两次大期间相隔时间也就只有半年左右,所以每次大都会心里有点低,基本就是摸底检查下。...性能指标其实在平时就关注了,而不是才来临时抱佛脚,那样其实为时已晚,只能拆东墙补西墙。...由于这篇文章不是讲怎么做性能压的,所以其他跟本篇文章关系的不大的情况就不介绍了。包括压网络隔离、压机器的配置和节点数等。

1.3K70

保障难?压失真?看看中通在性能测试上的探索与实践!

受双11、618等活动影响,井喷式的业务流量对中通的系统稳定性提出了更高的要求,过去的压方案已经无法满足业务发展的需求。...测试环境等比缩放导致压失真、庞大且复杂的系统链路梳理等都是棘手的问题,让我们一起看看中通是如何利用系统稳定性保障利器Takin来完成这项艰巨的任务的。...接下来详细说一下,链路梳理的目的步骤与需要拿到的关键信息 链路图 首先需要梳理出链路调用图,刚开始不需要太细,但需要对入口/出口/应用名/数据库/缓存/中间件/资金影响/邮件/短信等,类似这样的一些关键信息能梳理到...,运单,面单等多个业务共62个应用中进行了接入,成功支持了双11&618与淘宝&拼多多等大流量联合线上压的场景,虽然初步能解决原来压中存在的问题,但也引入了一些新的问题。...基本靠压人员自行维护。 压所积累的结果数据,无法在线形成压基线自动化对比,无法达成压结果在时间线上的可视化统计与分析。

1.3K20
您找到你想要的搜索结果了吗?
是的
没有找到

2020有赞双十一 | 齐心聚力,稳重带冲!

从设置目标阶段就开始从多个纬度思考,分析过去几年的数据流量和模型数据,推测出今年活动的流量,数据要足够精准,在这个基础上做一定的余量,既要能保证系统的稳定性,又不能浪费公司资源,主要围绕: 1、全链路压...:依据商家实际运营场景构建全链路压模型,对系统每周进行一次全链路压,验证系统的性能和能力,确保系统持续稳定运行。...,使得系统透明化、可视化、可监控化,能够第一时间感知系统运行情况。...为了保障商家活动能快速解决困惑与疑虑,作为直接触达商家,保障商家的服务团队,小伙伴们一刻也没有闲下来: 1、给商家出一些获客、促进转化的运营方法论。...一位位小伙伴冲在一线,帮助我们的商家,为添砖加瓦,我们也要为他们做好充足的弹药准备,保障最良好的战斗状态: 干劲十足的氛围,激励人心的启动会,满满的补给,作战室、休息区··· 相信我们的努力能为这次保障双十一商家的小伙伴们提供稳稳的助攻

1.1K20

京东618压测时自研中间件暴露出的问题总结,压数值40ws

前天618演练进行了全链路压,在此之前刚好我的热key探测框架也已经上线灰度一周了,小范围上线了2500台服务器,每秒大概接收几千个key探测,每天大概2-4亿左右,因为量很小,所以框架表现稳定。...导致实际压期间表现有点惨淡。 框架的架构如下: ? 大概0点多压开始,初始量比较小,从10w/s开始压,当然都是压的APP的后台,我的框架只是被动的接收后台发来的热key探测请求而已。...当然后来我自我感觉找到问题点了,又修改了一些,有待下次压检验。 这一篇就是针对各个发现的问题进行总结,包括压期间的和之前灰度期间发现的一些。...压发现的问题列表 前面发现的多是代码逻辑和配置问题,压期间主要是cpu100%的问题,也列一下。...3 caffeine密集扩容,耗费cpu   因为worker里是用caffeine来存储各client发来的key信息的,之后读取caffeine进行存取。

77010

“618”你准备好了吗?

一到心就慌?...诉求1   在期间,服务器承压往往是个重大的考验,而很多企业往往会忽视压力测试这一环节,没有正确预估系统能承载的最大流量,或是虽然提前做了压,但由于没有清晰完整的压规划和完善的应对方案,并没有真正了解各链路的承载能力...WeTest压大师领航智慧零售行业解决方案   为保障活动顺利开展,WeTest“压大师”专家团队为企业打造零售行业服务器性能解决方案,能够有效解决零售品牌数字化转型过程中涌现的系统性能瓶颈,...目前,压大师已为潮宏基、匡威、蒙牛等知名品牌提供过大前的压专家服务,帮助企业高效解决性能瓶颈问题,保障期间核心系统的稳定性。   ...压大师专家服务及智慧零售解决方案,请点击阅读原文咨询WeTest客服。 关于腾讯WeTest 腾讯WeTest是由腾讯官方推出的一式品质开放平台。

5.5K20

JDV背后的技术-助力618

Tech 导读 本文基于JDV平台在中的各种业务场景,讲解过程中使用情况和技术挑战,通过采取相应的技术创新、技术保障确保系统稳定性,推动数据可视化编排能力在屏业务场景中发挥更大的价值 01...JDV(可视化屏)是京东内部搭建可视化屏的数据工具平台,内置10+种模版特效,40+种风格各异的图表、导航等组件。...与集团其他数据工具打通,支持一式、自助化、拖拽式搭建屏,实现数据切换、联动刷新、屏下钻等呈现效果,便利高管、采销、产研等全集团范围内的数据可视化诉求。...,期间共搭建了80+张大屏,搭建屏过程中由于屏涉及相关人员较多,在期间沟通成本巨大,从4月底开始陆续评审需求后,5月初就需要完成作战指挥屏配合全链路压,京东视界和公关屏逐步进行搭建,过程中大屏需求须随时响应调整...沟通成本高:由于期间涉及各方向人员主要有业务方、产研以及三方接口及三方屏对应的产研等人员,期间屏共涉及86张各团队配合过程中各种大小事都需要及时沟通确认,出现这些问题的原因都是由于需求变更调整没有统一在

19430

机器人大闹光棍节:直击双11京东全链路军演ForceBot

电商期间存在不同于日常流量场景的高流量冲击,为了应对流量场景,保证期间用户可以顺畅地进行购买的一系列流程,而不会出现某个环节(比如支付环节)上的系统宕机或者数据错乱(比如商品库存量读写错误)...等情况,必须要在前进行全链路压,也就是进行前的军演,以便提前做好扩容及系统问题修复优化等。...既然全链路压是电商前必不可少的一个环节,且传统的全链路压方法又存在这么多的问题,那么,是否有更好的方法来进行全链路压,以节省人力物力和时间成本,且能够得到线上的真实数据,对系统资源进行更优的配置从而降低扩容浪费等行为呢...各系统压测量会以往年双11峰值作为基础量,在此基础上动态增加并发压力,同时区分对待两的场景:日常流量场景和流量场景。...图4 ForceBot Agent结构 ForceBot已经在多次电商中进行实践并取得了很好的果效。

1.3K60

京东618压测时自研中间件暴露出的问题总结,压级别数十万秒

前天618演练进行了全链路压,在此之前刚好我的热key探测框架(点击可跳转到开源地址)也已经上线灰度一周了,小范围上线了几千台服务器,每秒大概接收几千个key探测,每天大概几亿左右,因为量很小,所以框架表现稳定...从压开始的一瞬间,那台4核8G的机器就cpu100%,16核的cpu在90%以上,4核的100%即便在压暂停的间隙也没有恢复,一直都是100%,无论是10w/s,还是后期到几十万/s。...当然后来我自我感觉找到问题点了,又修改了一些,有待下次压检验。 这一篇就是针对各个发现的问题进行总结,包括压期间的和之前灰度期间发现的一些。...压发现的问题列表 前面发现的多是代码逻辑和配置问题,压期间主要是cpu100%的问题,也列一下。...3 caffeine密集扩容,耗费cpu 因为worker里是用caffeine来存储各client发来的key信息的,之后读取caffeine进行存取。

51910

全链路压(1):认识全链路压

13年之前,阿里每次为了准备双十一大系统能平稳支撑,都要花4-6个月准备,然后结束后花2个月时间打扫战场。...后来他们内部复盘,一番讨论后,为了避免后续的再次出现类似的问题,决定在生产搞压,这就是现在被很多测试同学所熟知的生产全链路压的背景由来。...提升对系统架构和业务逻辑的了解; 提升测试工程师在职场和求职市场的竞争力; 提前发现系统潜在的不稳定因素,提高线上系统稳定性; 更精准的容量评估和容量规划,降低系统的硬件成本和维护成本; 保障系统在秒杀等场景和峰值流量冲击下的稳定性...4、性能定位分析 全链路压是在生产环境进行,压过程中,除了要防止数据污染,完善的监控体系和实时的可视化链路追踪也是很重要的一点。...在整个压链路中,实时的可视化链路追踪能实时的观察到每个调用链路的具体信息,对问题的快速发现和定位有重大的帮助。 还要考虑到不把生产服务压挂。

3.1K20

全链路压第一次实践

1、核心链路梳理 各业务研发团队的owner对我们目前的核心业务链路进行了梳理,主要包括:首页、商品、订单、支付、用户、风控、优惠券、活动、基础服务。下面为示意图表: ?...3、压任务排期 根据任务规划,性能测试同学从中拆解出了较为详细的压任务,并进行排期,同时积极主动的推动了整个压任务的开展实施。...5、指标沟通 为保证压测流量和生产预估流量对齐,由技术负责人牵头,和运营产品同学进行了多次沟通,确认了本次双十一大活动相关的活动场次、时间段、优惠券投放量、预估DAU等相关关键指标。...比如:链路追踪监控的Cat、可视化监控大盘Grafana以及更多的监控组件。...四、未来的规划 为了保障明年的618、双11,同时为了应对业务快速发展,访问流量的剧增,我们已经开展了全链路压平台的建设工作,后续技术团队会不断投入精力去完善整个全链路压平台和相关工作,希望可以将压变成

3K40

腾讯计费:亿万级活动自动化保障体系

9月14-15日,GOPS全球运维大会上海圆满举行,为期两天的运维盛宴,为各位运维人带来了相互交流和学习的绝佳平台,来自腾讯技术工程事业群(TEG)计费平台部的黄宇给大家带来了「亿万级活动自动化保障体系...营销活动  营销活动是腾讯计费对内提供的一个核心服务,公司业务可以在计费平台上设置各种各样的营销活动,比如首次充值赠送、购买满赠、累计赠送、打折、抽奖、团购、砍价等等,支持的营销活动量级每年有几万个...业务活动期间,是存在相互干扰的,如果控制不当,单个业务的爆发式流量甚至会带来整个大盘的雪崩效应,这又该如何防范。...通过这样的方式来确保活动期间大盘不出现雪崩的风险。 小结 腾讯计费活动自动化保障体系,也就是按五个思路来构建。 一是大盘容量的压机制。...希望腾讯计费活动场景的自动化解决方案对您的场景有所参考,谢谢大家! ?

2.8K30

全链路压(4):全链路压的价值是什么?

SLA; 业务的目标:运营业务增长 前面聊了技术对业务运营的重要支撑作用,这里我们看看常见的业务场景,具备的几种特性: 业务可视 业务的可视,简单理解就是业务的状态,处在什么阶段,目前的效果可以直观的以可视化的状态来呈现...我们以电商最典型的来举例说明。 从上图可以看到,时候的线上系统稳定性保障,面临六挑战,分别是: 系统容量 的典型特点是流量大,对系统的冲击比较高。...技术能力 要保障线上服务稳定性,除了容量评估/故障演练/全链路压外,还需要其他技术手段如: 弹性扩缩容能力; 监控告警追踪能力; 限流降级熔断能力; 故障识别响应和技术优化; 效率 我们以电商的举例子...,要做到保障平稳度过,需要很多团队和角色的协调配合才能达成。...可以通过下图来看看,保障涉及的团队和要做的事情: 这种跨团队的协调配合,往往需要动员很多人力资源,而且特别耗时。 沟通协同 为什么这里要讲到沟通协同呢?

1.2K20

TEG海量运维服务背后的秘密

内容如下: 《微信图片语音等海量存储及CDN的自动化运维体系》 《亿万级活动自动化保障体系》 《大型DCI网络智能运营实践》 1 云存储和接入让文件和消息内容实时存放。...而当大批量业务同时段集中大营销活动,动辄几十倍的活动峰值,计费平台如何应用自动化、高可用保障体系来应对挑战。请听他为你细细道来。 《亿万级活动自动化保障体系》 ?...议题简介: 腾讯业务规模和数量逐年迅猛增长,节假日、周年庆等活动日趋常态化,特别是在节假日期间包括LOL 王者荣耀 QQ飞车等公司头部应用的大批量业务同时段集中大营销活动,动辄几十倍的活动峰值,如何对集群容量进行趋势预判...对此,腾讯计费构建了一套集现网压、资源扩缩容、播监控、鹰眼扫描、智能调度于一体的自动化、高可用保障体系,确保公司收入大盘万无一失。...分享大纲: 1、 介绍腾讯计费面对的业务复杂场景 2、 基于现网压的容量评估体系 3、 资源扩缩容及智能调度实现 4、 实时鹰眼监控扫描平台 3 腾讯DCI网络为公司业务提供了高速、稳定、安全的数据同步传输

2.9K20

40页PPT分享万亿级交易量下的支付平台设计

:线下的五一、国庆;线上的418、618、818、双11、双12,基本上每两个月就有一个S级;一方面要保证业务需求的快速响应,另一方面也需要保证的安全稳定,对来说业务需要快,对系统来讲需要稳,那就需要我们的系统...管控的可视化: 组件自治,资源弹性调度;每逢尤其是洪峰时候,需要执行应急预案,我们就需要知道,执行应急预案之后影响的用户场景,以及各个硬件执行过程当中的操作的步骤。...漏斗不同决定了的流量比例不同,比如前面有1万TPS,经过3层漏斗只剩1000TPS如果只有2层漏斗,可能剩下5000TPS,对资源的消耗是不一样的) 第二个阶段,我们开始做生产憋单压(比如代扣的订单憋在一起...我们最近也在建设机器人,实现自动巡检,和智能的治理,这个后面会讲到; 然后需要验证屏,可以直接看到对门店或交易是否有影响。...设计过多款行业领先的互联网金融产品,并荣获数项金融相关专利;主导过多次双11,618,818等稳定性设计和保障工作;丰富的从0到1规模研发团队搭建与管理经验。

2.4K20

智慧物流可视化,能否解决购物节后的爆仓危机?

99已经升级为继618年终、双十一之后的第三购物节,号称为“99划算节”,你都买了啥?每次大,物流信息迟迟不更新、商品运送慢已经成为经常被买家吐槽的话题。 物流爆仓产生的原因是什么?...爆仓意味着快递公司突然收到太多快递邮件,来不及分拣甚至再次收到,大量快递邮件滞留在始发或中转站,到达目的地的时间相对较长。 “爆仓”主要有两个原因。...而在可视化系统的实现下,智慧物流的管理实现将更加地便利。...、智慧化、一体化的3D可视化平台,实现视频监控、智能仓储、出入库作业、告警信息等可视化功能。...,实时掌握物流运营状态; 日常监控可视化:可对接所有物流仓储库房温湿度传感器、监控数据,随时可视化展示告警或形成整体监控态势图等,使仓储状况一目了然。

84940

浅聊电商系统如何备战618

所以对这两次大尤其重视。经历过这么多年的考验,各个公司也形成了一套适合自己的备战的策略。今天来给大家分享一二。 笔者所在公司也是电商行业,规模中等,一年的GMV(交易流水)也在几百亿。...峰值的订单一天也是百万单左右,所以压力还是有的,并且挑战还很大。如何保障期间系统的稳定性是我们近2个月重中之重的事情。 这里来跟大家分享下,我们是如何准备这次618的。...并且这只是备战的一方面,还有很多事情等着我们去做。 刚刚提到,提前2个月跟业务部门一起准备,从业务部门要明确2个重要的信息: 一.期间的预计单量或者交易额是多少?...封 版 准备,最后一个要做的地方就是封版,一般至少提前1-2个周。...这样做是尽可能保证期间系统是稳定的,除非有紧急情况,否则尽量不动生产系统,期间发版一个是风险很大,另外是人在高压下也很容易出错,大家都是凡人。

55230

《阿里测试之道》第二章笔记

2.1 全链路的风险和挑战 2.1.1 全球最大洪峰下的高可用挑战 2019年双11零点交易峰值是2009年的1360倍 2018年收货地址不可修改 2.1.2纷繁复杂的用户场景 2.1.3 无处不在的用户体验...资源共享 2.2.2 全链路压模型 各个业务入口集合 包含各个后端模型 预测各个场景QPS 预测和各个后端的比例 压模型要和玩法深度结合 构造压模型 2.2.3 全链路压执行策略...8.弹性容量 9.性能基线及报告 常态化智能压测流程 2.3 全链路功能 核心:影子体系 全链路功能 1.统一的环境隔离:隔离环境和修改时间 2.全链路影子数据:同步大批量线上数据到数据表中 3.用例精简...全民预演轮次及内容 2.4.5 预演问题收集及跟进 当日复盘模式进行复晒 201.9 延迟修复140例 告知客服,安抚客户 2.4.6 持续集成 2.4.7 全民演练支撑平台 1 准备过程自动化...90%(550条)用例自动生成 超8900个预演数据一键生成 自动领取资产5.2万次 节约成本169人日 2 环境稳定性 服务端环境:底层接口 客户端环境:浏览器、APP 3 无缝对接持续集成 自动录制

2.7K40

一文了解电商系统的高可用保障思路-献给技术伙伴们

图2.工作安排示意 4.2 事中:基于备战情况保持警惕备战状态 (1)每日邮件指标报表通晒 (2)每日错误日志收集并反馈和解决 (3)每日监控报警根因分析 (4)每日会同步当天系统应用和人员情况 (...(2)产研团队的系统需求保障情况,比如前期和中间上线的需求,上线情况和需求收益达成情况。...这块应该更多面对的是热点流量峰值的不确定性、用户行为的不确定性以及安全攻击等风控行为,需要结合风控团队对于黑产异常流量、异常IP、Cookie自动加入黑名单进行限流操作;同时结合进行压指标评估...笔者以自身当时经历来说,就是备战师要做到胸有成竹,在备战前应该充分了解核心链路业务,做好事前工作梳理,能够有着指南手册宣导给团队每一个人,做到精兵强将,人人互为备份,将监控报警可视化面板进行屏展示...参考资料: - 集团应用健康度指标 - 集团三道防线 - 集团军演全链路压资料

38420

【直播预约】手把手教您如何轻松应对流量高峰

使用开源压进行性能测试,通常只支持有限的协议和场景,需要人工进行可视化和自动化的管理和配置;监控和数据收集一般需要手动配置和管理,且难以进行实时监控和调整;人力成本较高。...秒杀抢购、活动等场景,需要大量机器多地域部署模拟海量用户的真实场景,需消耗的资源成本较高。 我们该如何低成本进行一键性能测试?...2023年4月25日 周二  19:30-20:30, 腾讯云可观测平台-云压产品研发手把手教您如何使用云压进行性能测试,轻松应对流量高峰。直播当晚更有云压秒杀活动,套餐包全场3折!...赶紧预约直播吧~ 直播介绍 (一)直播议题 《百万并发,一键压》-腾讯云可观测平台-云压产品介绍 (二)内容简介 全方位介绍云压,教您如何轻松应对流量高峰; 从应用场景出发,介绍标杆用户如何使用云压...拥有多年云原生/可观测/性能压领域的研发经验,目前    主要负责腾讯云可观测-云压(PTS)产品研发。 (四)内容大纲 1. 产品介绍:云压介绍、产品亮点 2.

36340
领券