, 最后重启5
以上步骤必须严格按此步骤执行, 操作不规范会进入一个非常痛苦的场景
如果你是这样操作的
停止1
停止2
zk集群正常,OK,回收机器
那结果就是大坑!!!...怎么补救
如果1,2的机器还在,或者说能够以原来的IP启动服务, 那此事比较容易
以原来的配置恢复1
以原来的配置恢复2
验证集群状态,是否为 【1,2,3,4,5】全部online ....然后再按照zk缩容的步骤下线
如果1,2的机器已然不在,而且你无法找到同样IP的机器,用于恢复服务,那此时只能以有损的方式,恢复到高可用状态
更改 3 的配置为 3,4,5 组一个zk集群, 然后重启3..., 此时集群会异常
再改 4 的配置为 3,4,5 组一个zk集群,然后重启4, 此时集群也会异常
改5的配置为 3,4,5 组一个zk集群, 最后重启5 , leader按预期会选举为4
为什么不能通过...增加 6 7扩容,再缩容的方式恢复服务了
刚刚异常的场景是 【1,2,3,4,5】,按扩容步骤, 应该是增加 6, 7
但是:
此时 3 , 4 , 5 的配置,认为是这样一个状态 【1,2,3