专栏首页TECH flower图解resilience4j容错机制

图解resilience4j容错机制

Resilience4j是一个轻量级、易于使用的容错库,其灵感来自Netflix Hystrix,但专为Java 8和函数式编程设计。轻量级,因为库只使用Vavr,它没有任何其他外部库依赖项。相比之下,Netflix Hystrix对Archaius有一个编译依赖关系,Archaius有更多的外部库依赖关系,如Guava和Apache Commons。 Resilience4j提供高阶函数(decorators)来增强任何功能接口、lambda表达式或方法引用,包括断路器、速率限制器、重试或舱壁。可以在任何函数接口、lambda表达式或方法引用上使用多个装饰器。优点是您可以选择所需的装饰器,而无需其他任何东西。 有了Resilience4j,你不必全力以赴,你可以选择你需要的。 https://resilience4j.readme.io/docs/getting-started

概览

本文将介绍resilience4j中的四种容错机制,不过鉴于容错机制原理的通用性,后文所介绍的这几种容错机制也可以脱离resilience4j而独立存在(你完全可以自己编码实现它们或者采用其他类似的第三方库,如Netflix Hystrix)。下面将会用图例来解释舱壁(Bulkhead)、断路器(CircuitBreaker)、限速器(RateLimiter)、重试(Retry)机制的概念和原理。

舱壁(Bulkhead)

Resilience4j提供了两种舱壁模式的实现,可用于限制并发执行的次数:

  • SemaphoreBulkhead(信号量舱壁,默认),基于Java并发库中的Semaphore实现。
  • FixedThreadPoolBulkhead(固定线程池舱壁),它使用一个有界队列和一个固定线程池。

SemaphoreBulkhead应该在各种线程和I / O模型上都能很好地工作。它基于信号量,与Hystrix不同,它不提供“影子”线程池选项。取决于客户端,以确保正确的线程池大小将与舱壁配置保持一致。

信号量舱壁(SemaphoreBulkhead)

?原图地址:http://images.dongxishaonian.tech/%E5%9B%BE%E8%A7%A3%E5%AE%B9%E9%94%99%E6%9C%BA%E5%88%B61.jpg

如上图,当信号量存在剩余时进入系统的请求会直接获取信号量并开始业务处理。当信号量全被占用时,接下来的请求将会进入阻塞状态,SemaphoreBulkhead提供了一个阻塞计时器,如果阻塞状态的请求在阻塞计时内无法获取到信号量则系统会拒绝这些请求。若请求在阻塞计时内获取到了信号量,那将直接获取信号量并执行相应的业务处理。

固定线程池舱壁(FixedThreadPoolBulkhead)

?原图地址:http://images.dongxishaonian.tech/%E5%9B%BE%E8%A7%A3%E5%AE%B9%E9%94%99%E6%9C%BA%E5%88%B60.jpg

FixedThreadPoolBulkhead的功能与SemaphoreBulkhead一样也是用于限制并发执行的次数的,但是二者的实现原理存在差别而且表现效果也存在细微的差别。FixedThreadPoolBulkhead使用一个固定线程池和一个等待队列来实现舱壁。当线程池中存在空闲时,则此时进入系统的请求将直接进入线程池开启新线程或使用空闲线程来处理请求。当线程池无空闲时接下来的请求将进入等待队列,若等待队列仍然无剩余空间时接下来的请求将直接被拒绝。在队列中的请求等待线程池出现空闲时,将进入线程池进行业务处理。

可以看到FixedThreadPoolBulkhead和SemaphoreBulkhead一个明显的差别是FixedThreadPoolBulkhead没有阻塞的概念,而SemaphoreBulkhead没有一个队列容量的限制。

限速器(RateLimiter)

?原图地址:http://images.dongxishaonian.tech/%E5%9B%BE%E8%A7%A3%E5%AE%B9%E9%94%99%E6%9C%BA%E5%88%B62.jpg

限速器(RateLimiter)的功能是防止突然的过量请求导致系统不堪重负,RateLimiter使用一个刷新周期的概念,限定在一个固定刷新周期内可处理的最大请求数量。若在某一个刷新周期内的请求数量已经达到最大,则本周期内接下来的请求将进入阻塞状态,如果在最大阻塞计时内新的刷新周期开启,则阻塞状态的请求将进入新的周期内进行处理。如最大的阻塞计时内新的刷新周期并未开启,则此时超出阻塞计时的那些请求将被直接拒绝。

断路器(CircuitBreaker)

?原图地址:http://images.dongxishaonian.tech/%E5%9B%BE%E8%A7%A3%E5%AE%B9%E9%94%99%E6%9C%BA%E5%88%B63.jpg

断路器(CircuitBreaker)相对于前面几个熔断机制更复杂,CircuitBreaker通常存在三种状态(CLOSE、OPEN、HALF_OPEN),并通过一个时间或数量窗口来记录当前的请求成功率或慢速率,从而根据这些指标来作出正确的容错响应。

当CircuitBreaker为CLOSE状态时客户端发起的请求将正常进入服务端系统,CircuitBreaker会计算出当前请求前的一个窗口里所有请求的异常率(失败率或慢速率),若异常率低于预期配置值,则系统将继续正常处理接下来的请求。当异常率不低于预期配置值时,此时服务端会进入OPEN状态,此时服务端将会暂时性的拒绝所有请求。在一段冷却时间(自定义配置)之后,服务端将自动进入HALF_OPEN状态,在半开状态服务端将尝试接受一定数量的请求(自定义配置),若这一定数量的请求的异常率低于预期,则此时服务端将再次恢复CLOSE状态,正常处理请求。而如果异常率还是高于预期则会继续退回到OPEN状态。

重试(Retry)

?原图地址:http://images.dongxishaonian.tech/%E5%9B%BE%E8%A7%A3%E5%AE%B9%E9%94%99%E6%9C%BA%E5%88%B64.jpg

重试机制比较简单,当服务端处理客户端请求异常时,服务端将会开启重试机制,重试期间内,服务端将每隔一段时间重试业务逻辑处理。如果最大重试次数内成功处理业务,则停止重试,视为处理成功。如果在最大重试次数内处理业务逻辑依然异常,则此时系统将拒绝该请求。

总结

本文介绍了常用的几种容错机制,与其说是resilience4j中的容错机制不如直接把resilience4j去掉,因为可以看到这些机制原理并不只来源于某个库或只与某个特定库有关,它更是一种设计理念,他的通用性应该是跨语言的。此外虽然本文只介绍了这几种容错机制,但是如何使用他们完全取决于你的业务场景和架构设计。你甚至可以随意组合使用它们,并且完全看不出这些组合最后所展示的效果像哪一种机制,那也没有关系,怎么使用、怎么组合完全取决于你所处的技术/业务环境。

本文分享自微信公众号 - TECH flower(tech-flower),作者:东溪陈姓少年

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2020-06-30

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 《面试补习》-熔断降级我学会了!

    高可用三剑客 限流,熔断和削峰 终于来到第二篇, 熔断降级专题了,想回顾限流相关内容的童鞋,可以查看一下,下面文章,欢迎点赞,收藏,关注三连,感谢!

    九灵
  • Spring Boot2+Resilience4j实现容错之Bulkhead

    Resilience4j提供了两种舱壁模式(Bulkhead),可用于限制并发执行的次数:

    东溪陈姓少年
  • 新项目不要再用 Spring Cloud Hystrix 了

    Spring Cloud 之前使用的断路器是 Netfilx 开源的 Hystrix 。被很多开发人员作为默认的断路器来使用。2018 年 11 月,当 Net...

    码农小胖哥
  • resilience4j小试牛刀

    resilience4j是一款受hystrix启发的容错组件,提供了如下几款核心组件:

    code4it
  • SpringCloud升级之路2020.0.x版-31. FeignClient 实现断路器以及线程隔离限流的思路

    在前面一节,我们实现了 FeignClient 粘合 resilience4j 的 Retry 实现重试。细心的读者可能会问,为何在这里的实现,不把断路器和线程...

    干货满满张哈希
  • Hadoop(七)HDFS容错机制详解

    前言   HDFS(Hadoop Distributed File System)是一个分布式文件系统。它具有高容错性并提供了高吞吐量的数据访问,非常适合大规模...

    用户1195962
  • 深入理解 Flink 容错机制

    场景描述:作为分布式系统,尤其是对延迟敏感的实时计算引擎,Apache Flink 需要有强大的容错机制,以确保在出现机器故障或网络分区等不可预知的问题时可以快...

    大数据真好玩
  • Hadoop(七)HDFS容错机制详解

      HDFS(Hadoop Distributed File System)是一个分布式文件系统。它具有高容错性并提供了高吞吐量的数据访问,非常适合大规模数据集...

    大道七哥
  • 2020-01-16 容错机制解析

    Dubbo集群容错机制解析 Dubbo的集群容错机制分为6种,分别是:FailOver,FailFast,FailSafe,FailBack,Forking,...

    Albert陈凯
  • Spring Cloud Gateway的断路器(CircuitBreaker)功能

    程序员欣宸
  • Storm容错机制(一):ACK机制

    我们知道 Storm 是一个常驻服务,消息源源不断的来,他源源不断的处理,那肯定在有些情况下会导致消息的不正确处理,比如worker进程挂掉了,那么正在被处理的...

    solve
  • Spring Cloud Circuit Breaker

    用户1215919
  • 3.5RDD的容错机制

    3.5 RDD的容错机制 RDD实现了基于Lineage的容错机制。RDD的转换关系,构成了compute chain,可以把这个compute chain认...

    Albert陈凯
  • Spark的容错机制

    天策
  • 拜占庭容错机制

    Client会发送一系列请求给各个replicas节点来执行相应的操作,BFT算法保证所有正常的replicas节点执行相同序列的操作。因为所有的replica...

    用户2909867
  • 【Storm篇】--Storm 容错机制

    Nimbus 资源调度 任务分配 接收jar包 Supervisor 接收nimbus分配的任务 启动、停止自己管理的worker进程(当前superviso...

    LhWorld哥陪你聊算法
  • middleware-常见容错机制

    潇洒
  • 国外程序员用的火热的Vavr是什么鬼?让函数式编程更简单!

    相信很多人关注 Vavr 的原因,还是因为 Hystrix 库。Hystrix 不更新了,并在 GitHub 主页上推荐了 Resilience4j,而 Vav...

    JAVA葵花宝典
  • SpringCloud升级之路2020.0.x版-2.微服务框架需要考虑的问题

    接下来我们逐个分析这个架构中的每个角色涉及的功能、要考虑的问题以及我们这个系列使用的库。

    干货满满张哈希

扫码关注云+社区

领取腾讯云代金券