首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

质量没有假期-小Q为你解密长假质量保证的那些事(三)

又到春节,还记得除夕夜大家玩得不亦乐乎的QQ红包吗?伴随着家家户户在欢声笑语中抢红包,各类QQ红包(刷一刷、拼手气、QQ AR、QQ空间等)迎来了堪比春运高峰期的用户流量,这将非常考验产品的弹性能力和运维能力。为迎接节假日的挑战, 保证产品服务质量,现网压测必不可少。下面由小Q为你解读节假日前鹅厂是如何开展现网压测来保证质量的。

现网压测目的

现网压测是为了评估业务容量、机型容量、代码质量等,验证服务能力和设备规模,找到业务链条中的瓶颈。长假前运维鹅会根据产品运营指标以及节假日效应预估业务峰值量进行设备扩容,在设备扩容前后,鹅们需要多次进行现网压测,从用户响应时间、设备资源、业务吞吐量等维度衡量扩容的设备是否能支持业务高峰期。

现网压测是对现网的变更行为,除了遵循变更发布的基本规范,更要做好万全的准备,遵循现网压测的要求,才能达到压测的目的,规避压测带来的影响现网服务质量的风险。

现网压测前

1

制定压测目标

要有明确的压测目标以评估压测结果是否符合预期,如鹅厂春节QQ红包,预测全网每秒的红包个数,验证单机的最大支撑能力以及线上全机房设备是否可以支撑目标等。

2

选择压测类型及方式

鹅厂现网压测类型分为离线和在线两种模式,在这两种模式下有对微服务(某段代码或接口)、模块(多段代码组合)、单机(各类机型)和全链路(业务层的整个业务链条)的压测,根据压测的目的和目标,选择压测类型,一般为以上多种类型的组合。

鹅厂现网压测一般通过CMLB/L5(负载均衡机制)、异地调度、TCP、UDP等方式,比如L5压测,可通过调整L5权重把现网流量逐步导入某些设备,找出软硬件服务的瓶颈。

3

确定压测内容

首先准备压测基础数据,包含压测的业务模块、压测对象版本号、压测机型、容量基准值、业务的指标值、评估指标值等,从业务功能和设备基础特性的维度准备压测的具体内容。

4

制定回滚措施和应急预案

现网压测最担心的莫过于压测时把服务压过载导致业务服务受影响,所以一定要有回滚措施和应急预案,以备不时之需。

5

制定现网压测时的监控方案

现网压测的监控检查指标项一般分为两大类:

设备基础特性监控项,包含CPU、磁盘负载、网卡流量、包量等;

业务功能特性监控项,如服务间的模块调用、CGI自动化测试等;

针对监控的指标项,确保监控系统就绪,告警机制明确,确保能及时获知在压测过程中出现的问题。

现网压测时

1

现场值守

若现网压测未实现工具化自动化,在压测过程中必须安排人工现场值守。

2

观察视图

观察各指标监控视图是否有异常,是否有外网用户反馈。

3

及时响应

压测到瓶颈或压测过程中产生异常,及时响应处理,启动紧急预案或回滚措施。

现网压测后

1

输出压测报告

压测报告内容包含压测时间、压测内容、压测曲线图、压测结论、压测异常分析等。

2

压测度量

1)压测过程中容量、TPS等指标呈线性增长,即压测对业务“无损”;

2)在压测预期值内各质量指标无明显异常;

3)用户体验无明显受损。

3

压测问题闭环

压测过程中若出现异常,业务体验有明显受损,则要分析问题原因,并制定相应的改进措施进行闭环管理。

春节进入倒计时,鹅们正在紧锣密鼓的开展着各项质量保证工作,质量没有假期,质量永远在线,现网稳定运营,有你有我有小Q。小Q祝大家新年快乐,2018一路发发发。

可在文章下方留言

我们共同探讨质量相关的话题

-----------------/ END /----------------

作者:小S

本文由原创发布于腾讯小Q聊质量

如需转载请联系我们

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180209G0ABD200?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券