健康检查异常排查

最近更新时间:2024-10-15 22:01:52

我的收藏
网关负载均衡(GWLB)通过健康检查来判断后端服务的可用性。若您遇到健康检查异常,可参考以下方式进行排查。
说明:
当健康检查探测到异常时,GWLB 将不再向异常后端服务转发流量。
当健康检查探测到所有后端服务都有异常时,请求将会被转发给所有后端服务。

健康检查探测频率过高

控制台设置5秒接收1次探测包,实际后端服务器发现1秒内收到1次甚至多次健康检查请求,导致健康检查探测频率过高的原因主要是和负载均衡的后端健康探测实现机制有关: 假设100万的 Client 端请求,会分散在4台 GWLB 后端物理机上,再转发给后端服务器。 健康检查探测是在 GWLB 的各个后端物理机上分别进行探测,因此,GWLB 实例设置5秒1次的探测请求时,实际上 GWLB 后端的每台物理机都会每5秒发送一次探测。此时后端服务器上可能会在5秒中收到4次探测请求。

该方案的优势是效率高,探测精准,避免误剔除。

如果您的业务对负载敏感性较高,高频率的健康检查探测可能会对正常业务访问造成影响,您可以通过增大探测时间间隔的方式来降低对业务的影响(例如设置为15秒探测一次)。

一个后端服务器可以添加在多个目标组中,并绑定在多个 GWLB 实例上时,每个 GWLB 实例都会发送健康探测报文用于探测该服务器是否健康,从而导致健康探测的频率较高。