1:什么是 Rebalance
Rebalance 本质上是一种协议,规定了一个 Consumer Group 下的所有 consumer 如何达成一致,来分配订阅 Topic 的每个分区。
例如:某 Group 下有 20 个 consumer 实例,它订阅了一个具有 100 个 partition 的 Topic 。正常情况下,kafka 会为每个 Consumer 平均的分配 5 个分区。这个分配的过程就是 Rebalance。
2:Rebalance触发的机制
3:Rebalance触发引发的问题
当消费者正在消费数据,这个时候多了个消费者,消费数据会被暂停,这个时候offset可能没被提交,但是这批数据在rebalance之后会被重新消费,造成数据可能被重新消费。
4:Rebalance 过程分析
Rebalance 过程分为两步:Join 和 Sync。