灵活应对流量压力,定期压测服务器,鹿晗结婚都不怕

热点来的太快就像龙卷风,明星的八卦总能作为事件引发热点。

10月8日,鹿晗与关晓彤恋情公布,瞬间上了热搜,粉丝炸了,微博的服务器也跟着瘫痪了。

微博瘫痪,让一位微博工程师在结婚的当口放下酒杯,开始扩容服务器,真是哭笑不得。更有网友吐槽,鹿晗其实是个老黑客,让众码农汗颜。

虽然微博这次瘫痪防不胜防,毕竟明星公布恋情如何预警?然而服务器准备不足也是一点。看看这条微博:顶级流量,可怕的传播层级,如下图所示...

聊完八卦,回归主题:服务器压力。所以你家的服务器还好么?虽不是所有产品都能像微博拥有亿万量级,但在产品预期范围内出现问题,那即便再精美的产品也无法留住用户的心。

一、先谈谈服务器相关的性能指标,有很多,但不可能全看,那么有哪些核心呢?

1、90%响应时间

是指所有用户的响应时间由小到大进行排序,第90%的响应时间,是用来评估系统容量的重要指标之一。

2、TPS性能,关注服务器的服务能力

每秒系统处理事务(通过、失败以及停止)的数量。通过它可以确定系统在任何给定时刻的时间事务负载。

3、支持的最大在线人数

指同时登录站点的最大人数或者服务器同时接收下载的最大数量。

4、服务器自身压测过程总CPU、内存等的变化情况

CPU利用率是指:CPU执行非系统空闲进程的时间/CPU总的执行时间;内存占用率指的是此进程所开销的内存。

5、事务成功率

事务成功率=成功处理的事务/所有事务*100%,是检测服务器处理事务成功几率的重要指标。

二、市面上有哪些服务器压测方法

为了能够帮助用户更快捷的获得服务器的核心数据,市场产生了诸多各式各样的压测方法,但也存在各式各样的问题:

1、现网数据预估

根据压力测试过程中的部分数据,对未来大量用户访问的情况机型预估。

存在问题:只适合简单的服务器拟合,复杂服务器数据就不太准确。

2、真人压测

通过邀请一定数量的真实用户来玩游戏,从而对服务器达到一个测试效果。

存在问题:暴露出的性能问题有限,封测人数通常还是太少,虽然有几百或者几千用户在玩,但是并发并不够,不足以暴露服务端性能问题;另外不适合调优,真人无法完全重复相同行为,服务器就难以进行回归调优。

3、接口测试

选择一些具有代表性的功能,通过以小见大的方式,来评估整套服务器性能。

存在问题:无法遍历整个服务器的接口,难以避免一些微小的问题。

4、录制回放

通过抓取数据包的方式,来获取游戏时的协议,再把这些捕获的协议重新发送给服务端,通过工具放大协议量级达到性能测试的目的。

存在问题:面对复杂的协议交互,单纯的放大数据包,无法产生足够压力。

5、机器人模拟

 通过高还原真实玩家的用户行为,模拟高并发场景,从而得到类似很多人同时游戏的测试效果。

这些方法各有优劣,腾讯内部普遍使用“机器人模拟”的方法进行压测,而“机器人模拟”的压测方法需要充足的测试时间和很大的人力投入,为此腾讯制定了一个较为通用的测试流程,用以提升压测效率。

三、腾讯内部服务器性能的测试流程介绍

根据腾讯内部游戏和产品的使用需求,腾讯WeTest团队首先针对http与https协议的页面,梳理了一个通用的压测流程。

1、 确定压测场景,比如登录,获取信息列表等

测试人员第一步要做的就是测试方案的确认,主要就是提前模拟实际业务中涉及的场景以及场景中用户的使用行为,通常需要确认这样几点:

1) 确认用户的登录状态,用户的登录态是否会不断变化

2) 用户登录后的访问路径之间的上下文关系

3) 访问路径之间的参数传递关系

2、 测试人员编写测试用例

编写测试用例就是将上述模拟场景具体化的过程,包括确认压测的人数,人数递增逻辑,具体需要压的接口,接口之间的参数传递等。

3、 启动机器人进行测试,渐进增加机器人数量

在确认了测试方案后,这一步就是执行的过程,根据测试方案中预估的压力人数,渐进的增加压力的人数。

4、 记录分析数据及事务处理情况,查看服务器负载的变化以及服务器的当前承载能力。

上一步提到了要渐进增加机器人,那么为什么要渐进增加机器人?因为在服务器并发增加的过程中需要不断监控上文服务器的核心数据,不断挑战服务器处理能力的极限,避免上来就使用一个过高的并发数直接超过了服务器处理能力的极限,从而无法起到性能优化的目的。

一般来说,在机器人增加的过程中,CPU的突然跑满以及响应时间瞬间变长,都可能是服务器产生了瓶颈。因此压测人员需要实时监控压测上升过程中的服务器情况变化,从而定位问题所在。

5、 调整配置,迭代测试,预估服务器的承载能力以及可能存在的性能瓶颈

在发现基本的测试问题后,测试人员需要通过不断的调试来定位问题,然后重新发起压测,知道实现最终的测试目的。

根据这个测试流程,腾讯内部也总结了一些压测产品所需要具备的特点。

1)    简单易上手

产品的业务场景是多变的,但是好的压测产品应该让这个场景配置过程变得简单易用,用户在简单输入需要压测的URL即可进行各个接口的测试,大部分测试配置建议提供一个默认值,用户对功能更加了解之后可以自由配置这些参数。

2)    进阶功能完善

除了简单易用之外,也要给用户提供一些进阶的功能,在简单输入URL的基础上,可以支持用户自定义变量,从文件读取变量,甚至从其他URL的返回值获取变量的值,可以比较真实模拟真实场景,避免请求变量单一。

3)    提供分布式压力机进行压测

由于单机的局限性,压测产品可以使用分布式压测的框架,根据用户配置的机器人数量动态分配多个压测机,极大提升压力上限。

4)    详细的测试数据统计

压测大师会记录测试过程中的多项数据,包括在线人数变化、TPS变化、响应时间、收发包流量、服务器CPU内存状态、压力机硬件负载、测试结果统计等,可以快速定位服务器的容量以及瓶颈。

基于这些需求,腾讯WeTest团队开发了专注服务器压测的产品“压测大师”,简化了压测配置过程,用户可以在线上部署,线上调试,线上查看报告,帮助用户成为最高效的“压测大师”。

WeTest压测大师旨在降低开发者在服务器性能测试方面的门槛,迅速发现服务器端的性能瓶颈,进行针对性的性能调优,降低服务器采购和维护成本,提高用户留存和转化率。目前主要优势如下:

Ø  一分钟发起测试,无需编写脚本

Ø  无需配置压力机,随开随用,轻松发起十万压力

Ø  支持HTTP、HTTPS等协议,覆盖Web,H5,APP,游戏等主流场景

Ø  实时查看测试报告,多维度报告对比,迅速定位性能瓶

目前WeTest压测大师已经正式对外开放:

✬如果你喜欢这篇文章,欢迎分享到朋友圈✬

关于腾讯WeTest

腾讯WeTest是腾讯游戏官方推出的一站式游戏测试平台,用十年腾讯游戏测试经验帮助广大开发者对游戏开发全生命周期进行质量保障。 腾讯WeTest提供:兼容适配测试;云端真机调试;安全测试;耗电量测试;服务器压力测试;舆情监控等服务。

原文发布于微信公众号 - 腾讯WeTest(TencentWeTest)

原文发表时间:2017-10-11

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

编辑于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏云计算D1net

构建更好的云灾难恢复计划指南

如今,灾难恢复即服务很快成为企业利用云计算解决灾难恢复挑战的理想方式。 灾难恢复仍然是存储专业人员面临的持续挑战。因为,与IT的许多其他领域不同,围绕灾难恢复...

347120
来自专栏EAWorld

微服务的4个设计原则和19个解决方案

微服务架构现在是谈到企业应用架构时必聊的话题,微服务之所以火热也是因为相对之前的应用开发方式有很多优点,如更灵活、更能适应现在需求快速变更的大环境。 本文将介绍...

51770
来自专栏WeTest质量开放平台团队的专栏

双十一临近,怎样让买家流畅地秒杀? ——腾讯 WeTest 独家开放电商产品压测服务

从拍脑袋到场景化压测,双十一的现象级大促从来不是一蹴而就。

30200
来自专栏IT大咖说

老牌大型门户网站多年经验——搜狐服务架构优化

内容来源:2017 年 08 月 10 日,搜狐研发中心架构师陈伟在“第二届APMCon中国应用性能管理大会”进行《搜狐服务架构优化实践》演讲分享。IT 大咖说...

18920
来自专栏后台 开发

后台系统搭建经验思考

去年部门开始转向云业务,有幸参与一个较大的项目,从0到1开始一个后台系统的建设,从开始规划到进行项目交付,总结梳理一下在这个期间我们的思路是怎样的?

26970
来自专栏测试驿栈

<转>性能测试浅谈

本文主要针对WEB系统的性能测试。不涉及具体的执行操作,只是本人对性能测试的一点理解和认识。

23950
来自专栏IT米粉

技术知识和稳定的系统之间,可能还差这些?

艺术的展现除了术,还需要道。程序的术是大家都能得到的共识,各种各样提升自己技术的文章到处都是,这里我们说说程序的道,也就是方法。这也是大家经常忽略或者不重视的地...

44180
来自专栏云计算D1net

破译混合云架构的关键点:云数据传输

混合云架构融合了私有云和公有云,如何部署混合云已经成为IT圈里面最热门的话题之一。大部分数据中心团队都发现这种架构在技术上具有极大的挑战,这些挑战主要源于各种工...

43680
来自专栏知晓程序

想要留住小程序用户?这个方法你一定能用上 | 小程序问答 #48

但是这个能力限制多多:除了需要小程序开通微信支付、只有支付后才能推荐关注外,关注的公众号还必须是服务号才行。

15440
来自专栏韩伟的专栏

游戏服务器端有什么特别

在游戏服务器端开发所有要面对的问题中,有两个是最核心和最普遍的:一是和客户端的通讯;二是游戏登录用户的数据处理。

1.2K140

扫码关注云+社区

领取腾讯云代金券