稳定性三十六计-超时处理

引子

分布式系统调用的三态

在传统的单机系统中,调用一个函数,要么返回成功,要么返回失败。这就是两态系统(2-state system)。

在分布式系统中,由于系统是分布在不同机器上的。还可能有一种状态叫:超时。成功、失败和超时是分布式系统调用的三态。

为什么要超时处理

对于超时这种状态,长时间等待会影响用户体验,并发量大时还可能会因为线程池耗尽而不能响应其他请求。如果这个服务的调用方也是一个服务,那就有可能产生级联反应,导致其他服务不可用,最终产生雪崩效应。

超时处理的手段

超时处理的两个要点:判断什么时候超时和超时后怎么处理。

判断什么时候超时在无基础数据时可通过经验估算一个相对合理值。在服务上线后可依赖统计进行设置,比如设置99%的请求响应时间为超时时间。还可以通过人工智能进行调参来设置。

超时后一般采用快速失败,如果不是核心服务,可直接超时返回失败。如果是核心服务,可以设置相应的重试次数。

HTTP请求超时处理

HTTP请求一般会对两个阶段做超时处理:建立连接阶段、数据通信阶段。在apache的HttpClient实现中,添加了获取连接池阶段。

获取连接池阶段

因为建立连接需要IO、网络带宽等开销,需要池化处理,如果超过了连接池的最大值,则需要等待其他连接执行完释放资源。超时时间一般设置为1s之内。

建立建立阶段

HTTP请求需要“三次握手”,第一次握手客户端发送一个报文到服务器表示想和服务端建立连接。第二次握手是服务端接收到客户端的请求,返回带有同步和相应标记的客户端报文,询问客户端是否准备好。第三次握手是客户端再次响应服务端表示已经准备好。超时时间一般设置为1s到5s。

数据通信阶段

与目标url建立连接后,等待数据报文传输的时间。这个阶段又叫做socket通信阶段。这个阶段可能有两种类型的事件:读取和写入。超时时间一般设1s到5s。

在以上三个阶段的任何一个阶段发生超时则立即终止等待返回失败,http请求一般会设置超时后有三次重试。为了进一步理解,可以借助HttpClient的调用代码来感受一下其使用

    HttpParams httpParams = new BasicHttpParams();

    // 获取连接的最大等待时间1s,对应获取连接池阶段

    ConnManagerParams.setTimeout(httpParams, 1000);

    // 连接超时时间5s,对应建立建立阶段

    HttpConnectionParams.setConnectionTimeout(httpParams, 5000);

    // socket超时时间5s,对应数据通信阶段

    HttpConnectionParams.setSoTimeout(httpParams, 5000);

最近因为OkHttpClient比HttpClient更简单易用,使用的人多起来。借助OkHttpClient的调用代码来感受一下其使用

    OkHttpClient.Builder httpClientBuilder = new OkHttpClient.Builder();

    // 连接超时时间5s,对应建立建立阶段

    httpClientBuilder.connectTimeout(config.getConnectionTimeout(), TimeUnit.MILLISECONDS);

    // 读取超时时间5s,对应数据通信阶段(将socket细分为读取和写入两种类型)

    httpClientBuilder.readTimeout(config.getReadTimeout(), TimeUnit.MILLISECONDS);

    // 写入超时时间5s,对应数据通信阶段(将socket细分为读取和写入两种类型)

    httpClientBuilder.writeTimeout(config.getReadTimeout(), TimeUnit.MILLISECONDS);

读取和写入都是socket阶段的一个证据是如果发生超时,曝出的异常是SocketTimeoutException

Mysql连接超时处理

客户端和Mysql连接也分为建立连接和数据通信两个阶段。目前mysql常用的版本是5.6和5.7。

和超时处理相关的参数汇总如下

参数名称

参数说明

缺省值

最低版本要求

connectTimeout

和数据库服务器简历socket连接时的超时 单位:毫秒。0表示永不超时

0

3.0.1

socketTimeout

socket操作(读写)超时 单位:毫秒。0表示永不超时

0

3.0.1

autoReconnect

当数据库连接异常中断时是否自动重连

false

1.1

maxReconnects

autoReconnect=true时,重试连接的次数

3

1.1

failOverReadOnly

自动重连成功后,连接是否设置为只读

true

3.0.12

autoReconnectForPools

是否使用针对数据库连接池的重连策略

False

3.1.3

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

扫码关注云+社区

领取腾讯云代金券