前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >RocketMQ消息为什么会被重复消费?

RocketMQ消息为什么会被重复消费?

作者头像
Java识堂
发布2022-04-06 10:36:34
2.4K0
发布2022-04-06 10:36:34
举报
文章被收录于专栏:Java识堂Java识堂

从上帝视角看一下消息发送和消费

当我们使用RocketMQ时,RocketMQ-Dashboard是一个非常好用的图形化界面工具

我们首先在RocketMQ-Dashboard上创建一个topic,每个topic下4个队列

每个topic是一类消息的集合,topic下面再细分queue是为了提高消息消费的并发度

「当producer发送topic消息时,应该往topic下的哪个queue来发送呢?」

producer会采用轮询的策略发送

「那么consumer应该消费哪个queue下的消息呢?」

当有一个消费者时当然是消费所有的queue

「如果有多个消费者呢?」

只需要根据各种负载均衡策略将队列分配给消费者即可,如下图是两种负载均衡的方式

你问我这两种负载策略怎么实现的?去看看源码呗,详细过程我就不分析了

「如果消费者数量超过队列的数量会发生什么?」

多出来的消费者将不会消费任何队列

「为什么一个consumer只能消费一个queue呢?」

多个消费者消费一个queue肯定会有并发问题,所以得加锁,这样还不如把topic下的队列数量设置的多一点

「我在运行的过程中可以设置topic下queue的数量吗?」

当然可以。不仅可以重新设置queue的数量,还可以实时增减consumer,以应对不同流量的场景

「那这样说当queue或者consumer的数量发生变化的时候,需要重新执行负载均衡吧?」

是的,大家一般把这个过程叫做重平衡

下面我们来分享一下详细的细节

消息发送流程

消息发送主要有3种方式单向发送(只发送,不管结果),同步发送和异步发送

消息消费流程

消息是基于推还是拉?

消息消费的模式有两种方式:

  1. 拉取:Consumer不断从Broker拉取
  2. 推送:Broker向Consumer推送

这两种方式都有各自的缺点:

  1. 拉取:拉取的间隔不好确定,间隔太短没消息时会造成带宽浪费,间隔太长又会造成消息不能及时被消费
  2. 推送:「推送和速率难以适配消费速率」,推的太快,消费者消费不过来怎么办?推的太慢消息不能及时被消费

「看起来拉取和推送难以抉择」

然后就有大佬把拉取模式改了一下,即不会造成带宽浪费,也能基于消费的速率来决定拉取的频率!

「你猜怎么改的?」

其实很简单,Consumer发送拉取请求到Broker端,如果Broker有数据则返回,Consumer端再次拉取。如果Broker端没有数据,不立即返回,而是等待一段时间(例如5s)。

  1. 如果在等待的这段时间,有要拉取的消息,则将消息返回,Consumer端再次拉取。
  2. 如果等待超时,也会直接返回,不会将这个请求一直hold住,Consumer端再次拉取

「对了,这种策略就叫做长轮询」

「RocketMQ中有拉和推两种消费方式,但是推是基于长轮询做的」

具体消费流程

「拉取到消息后是怎么处理的呢?」

PullRequest类的成员变量如下图

当拉取到消息后,消息会被放入msgTreeMap,其中key为消息的offset,value为消息实体

「另外还有一个重要的属性dropped,和重平衡相关,重平衡的时候会造成消息的重复消费,具体机制不分析了,看专栏把」

msgCount(未消费消息总数)和msgSize(未消费消息大小)是和流控相关的

「什么是流控呢?」

就是流量控制,当消费者消费的比较慢时,减缓拉取的速度。如下图

当从阻塞队列中获取PullRequest时,并不会直接发起网络请求,而是先看看是否触发流控的规则,比如未消费的消息总数超过一定值,未消费的消息大小超过一定值等

接着就是收到响应,处理消息,并键PullRequest再次放入阻塞队列.

「是不是落了一个步骤?就是Consumer告诉Broker这部分消息我消费了?」

嗯嗯,你是不是以为提交offset的过程是同步的?其实并不是,「是异步的」

Consumer怎么提交offset?

当consumer消费完消息只是将offset存在本地,通过定时任务将offset提交到broker,另外broker收到提交offset的请求后,也仅仅是将offset存在map中,通过定时任务持久化到文件中

「这样就会造成消息的重复消费」

  1. Consumer消费完消息并不是实时同步到Broker的,而是将offset先保存在本地map中,通过定时任务持久化上去。这就导致消息被消费了,但是此时消费者宕机了导致offset没提交,下次没提交offset的这部分消息会被再次消费
  2. 即使offset被提交到了Broker,在还没来得及持久化的时候Broker宕机了,当重启的时候Broker会读取consumerOffset.json中保存的offset信息,这就会导致没持久化offset的这部分消息会被再次消费
本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2022-03-28,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Java识堂 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 从上帝视角看一下消息发送和消费
  • 消息发送流程
  • 消息消费流程
    • 消息是基于推还是拉?
      • 具体消费流程
        • Consumer怎么提交offset?
        相关产品与服务
        负载均衡
        负载均衡(Cloud Load Balancer,CLB)提供安全快捷的流量分发服务,访问流量经由 CLB 可以自动分配到云中的多台后端服务器上,扩展系统的服务能力并消除单点故障。负载均衡支持亿级连接和千万级并发,可轻松应对大流量访问,满足业务需求。
        领券
        问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档