专栏首页johnnyxsu技术交流分享CLB健康检查异常排查流程
原创

CLB健康检查异常排查流程

CLB健康检查是指负载均衡实例定期向后端服务器发送 Ping、尝试连接或发送请求来测试后端服务器运行的状况。当后端服务器实例被判定为不健康时,负载均衡实例将不会把请求转发到该实例上。健康检查会对所有后端服务器(不管是判定为健康的还是不健康的)进行,当不健康实例恢复正常状态时,负载均衡实例将恢复把新的请求转发给它。

目前CLB健康检查分为四层转发健康检查和七层转发健康检查,他们的健康检查方式是不同的。

四层转发健康检查

四层转发的健康检查机制由负载均衡器向配置中指定的服务器端口发起访问请求,如果端口访问正常则视为后端服务器运行正常,否则视为后端服务器运行异常。对于TCP的业务,使用 SYN 包进行探测。对于 UDP 业务,使用 Ping 进行检查。

七层转发健康检查

七层转发的健康检查机制由负载均衡器向后端服务器发送 HTTP 请求来检测后端服务,负载均衡器会通过 HTTP 返回值是否为http_2xxhttp_4xx来判断服务是否正常。后续会推出用户自定义的方式,对响应代码所代表的状态进行描述。假设在某场景下,HTTP 返回值为http_1xxhttp_2xxhttp_3xxhttp_4xxhttp_5xx 这几种,用户可以根据业务需要编辑http_1xxhttp_2xx为服务正常状态,并设置http_3xxhttp_5xx的返回值代表异常状态。

健康检查探测源

健康检查对内网CLB和外网CLB,探测源是不同的。

1.内网CLB

私有网络:内网LB采用169.254的IP来探测,并且已经加入DFW白名单(即不受客户安全组限制,但是受iptable限制)

基础网络:内网LB采用探测机的接口IP来探测,也加入了DFW白名单(即不受客户安全组限制,但是受iptable限制)

2.公网CLB

探测源是CLB的VIP,需要用户的机器放通vip(受客户安全组限制而且受iptable限制)

健康检查异常排查

了解了健康检查的原理,下面就介绍一般排查健康检查的一些思路。

1.RS监听是否启动

首先需要查看CLB后端的CVM监听是否正常,可以借助如下命令检查。

netstat -anp|grep [RS监听端口号]

查看RS对应的端口是否在监听

2.如果是公网CLB,查看是否开启公网带宽

目前腾讯云上公网CLB分为带宽上移用户和非带宽上移,如果在CLB控制界面能够设置公网带宽,此账号是带宽上移用户,CLB的网络计费是在CLB的VIP侧计费。如果是非带宽上移的账号,CLB的网络计费是在CVM侧计费。

能够在CLB控制台修改带宽,为带宽上移用户

非带宽上移用户由于无法在CLB界面调整带宽,其带宽的计费是在CVM侧,需要到CVM管理界面调整带宽。必须要确保外网CLB都出带宽,这样才能使外网客户端访问到CLB,健康检查才能够正常。

3.安全组规则检查

根据上文的探测源介绍,根据不同的类型的CLB,安全组需要放通相应的规则。安全组需要放通访问来源,外网CLB放通VIP,内网CLB放通内网段。

目前,CLB和CVM都可以设置安全组,需要分别对其安全组进行核实。(CLB安全组在CLB的管理界面设置,CVM安全组在CVM的管理界面设置)

4.iptables规则检查

在CVM侧使用如下命令可以查看是否开启iptables以及iptables的具体规则。

#centos 6.* 
service status iptables #查看iptables是否启动
iptables -L #查看iptable具体配置

#centos 7.*
systemctl status firewalld #查看防火墙是否启动
firewall-cmd --list-all  #查看防火墙具体配置

iptables放通访问来源,外网CLB放通VIP,内网CLB放通内网段。

如果设置iptable,一定要对腾讯云特殊的内网地址放通10.0.0.0/8和169.254.0.0/16

腾讯云全部内网地址:

10.0.0.0/8

172.16.0.0/12

192.168.0.0/16

100.64.0.0/10

169.254.0.0/16

总而言之,就是探测源不一样,放通的地址也是不一样。

5.检查是否开启TCP快速回收

是否开启了tcp 快速回收,通过如下命令可以查看是否开启了TCP快速回收。

 cat /proc/sys/net/ipv4/tcp_tw_recycle
 cat /proc/sys/net/ipv4/tcp_timestamps

一般在服务端是不推荐开启net.ipv4.tcp_tw_recycle 参数,会导致处于NAT用户访问CLB出现异常断开等问题。详细内容可以参见本人写的另一篇文档 《玩转CVM之tw_reuse和tw_recycle》

如果以上都排查没有问题,但健康检查还异常,请联系腾讯云售后人员进一步排查。

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • CLB健康检查原理及异常排查

    七层健康检查,使用HTTP协议,支持GET、HEAD两种请求方法,HEAD只获取头部信息,不获取实际内容,更加轻量的探测,两种方式,都是依赖RS返回的HTTP ...

    Rokas.Yang
  • clb健康检查

    负载均衡可以定期向后端服务器发送 Ping 命令、尝试连接或发送请求来探测后端服务器运行的状况,这些探测称为健康检查。负载均衡通过健康检查来判断后端服务的可用性...

    王帅-smaitwang
  • CLB日志核心的玩法你Get到了吗?

    BruceLong
  • CLB后端的CVM端口健康检查偶尔异常

    【排查步骤】 1、健康检查探测机制是clb的vip向后端cvm业务进行探测,所以先在cvm上抓包看是否有收到探测包

    Z .H
  • 负载均衡的健康检查

    腾讯云的负载均衡产品发布至今,产品形态变化还是比较大的,最开始有传统型负载均衡,应用型负载均衡,后面结合自身产品特性以及云上相关用户的产品需求,逐渐开始改造,使...

    云售后焦俊成
  • CLB日志核心的玩法你Get到了吗?

    CLB日志还有类型?当然CLB维护着千亿QPS的网关产品,精细化运营管理还是很齐全的。

    tinkerli
  • 解密 apiserver 日志报错之 TLS handshak eerror

    http: TLS handshake error from x.x.x.x:52493: read tcp x.x.x.x:30443->x.x.x.x:52...

    keepyan
  • 腾讯云公网负载均衡技术实现详解

    本文主要讲述了腾讯云CLB的基本概念,业务架构以及公网LB技术实现。

    朱彬峰
  • 腾讯云负载均衡CLB怎么用?

    前面我们写过《如何处理网站高并发流量问题?》,里面用到了负载均衡,今天我们来讲讲腾讯云负载均衡CLB怎么用。

    弦山
  • 常用云PaaS组件及开源组件业务运维指南

    用于指导使用腾讯云的PaaS组件和常用开源组件进行业务开发的服务的部署实施环节和后续生产环境运维。文档摘取了腾讯云的官网文档中运维需要关注的技术指标,应用于初创...

    ivanshang
  • TKE中 Logstash 日志定时出现Connection Reset By Peer的解决方法

    久闻K8S的大名,一直想把业务都迁移到上面降低运维成本,但无奈业务迁移不可能一蹴而就,遂决定先将不那么重要的日志处理模块 Logstash 先行上云,这样即使出...

    风津渡
  • 什么是负载均衡?

    负载均衡是高可用性基础架构的关键组件,通常用在多个服务器之间分配工作负载来提高网站、应用程序、数据库和其他服务的性能和可靠性。

    司徒永哥
  • 腾讯云CLB日志接入/分析/可视化/告警

    建议:按照业务实际情况区分不同的日志主题,比如http层,缓存层,数据层或者按照业务维度,金融业务,主站业务,订单业务等,因CLS也同时是一个管道,对应不同的日...

    tinkerli
  • 腾讯云7层负载均衡日志分析与监控

    建议:按照业务实际情况区分不同的日志主题,比如http层,缓存层,数据层或者按照业务维度,金融业务,主站业务,订单业务等,因CLS也同时是一个管道,对应不同的日...

    tinkerli
  • www2992019com请拨18687679495银河国际腾讯云IPv6私有网络及负载均衡最佳实践指南

    腾讯云目前已经推出IPv6负载均衡和IPv6 NAT64负载均衡。其中IPv6 NAT64绑定的是云服务器的IPv4地址,可以帮助用户在不升级Web应用即平滑接...

    用户7106032
  • Kubernetes网络疑难杂症排查分享

    大家好,我是 roc,来自腾讯云容器服务(TKE)团队,经常帮助用户解决各种 K8S 的疑难杂症,积累了比较丰富的经验,本文分享几个比较复杂的网络方面的问题排查...

    CNCF
  • Kubernetes 网络疑难杂症排查分享

    到目前为止,本人见到的最有诚意的 K8s 网络问题分享,而且还有小图片呢!迫不及待的申请了转载授权。

    崔秀龙
  • Kubernetes 网络疑难杂症排查分享

    大家好,我是 roc,来自腾讯云容器服务(TKE)团队,经常帮助用户解决各种 K8S 的疑难杂症,积累了比较丰富的经验,本文分享几个比较复杂的网络方面的问题排查...

    imroc
  • Kubernetes 网络疑难杂症排查分享

    大家好,我是 roc,来自腾讯云容器服务(TKE)团队,经常帮助用户解决各种 K8S 的疑难杂症,积累了比较丰富的经验,本文分享几个比较复杂的网络方面的问题排查...

    米开朗基杨

扫码关注云+社区

领取腾讯云代金券