某项目生产环境压测过程中,不带登录态访问官网首页,QPS值能达到5W多;带登录态访问首页,QPS下降10倍,不到5K。
1.首先要了解全压测链路,快速定位可能出问题的环节。
从上面来看,出问题的链路是:Web接入层(Node,40台机器)->sso服务(校验登录态)
2.查看Web接入层和SSO服务的资源占用。
Web接入层 :带登录态访问时CPU明显不高,而不带登录态时高达80%(单台Node机器)
SSO服务:机器负载并不高,带宽也不高。
3.web接入层查看函数耗时。
检验登录态(checklogin)有超时和错误。
4.询问了sso服务的同学,是触发了频控。
5.对压测机器IP加白后,还是触发了频控。
6.sso服务的开发查了日志发现,触发总量频控。
7.放开总量阈值,还是触发频控制,原因是整个链路上的机器都要加白。
8.接下来没有收到告警了,但QPS波形图表现确实没有好转。
本文展示了限制频率的几种方式:单IP限制,总访问量限制。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。