升级实例内核小版本

最近更新时间:2025-08-06 10:54:22

我的收藏
消息队列 CKafka 版专业版支持升级内核小版本,实现新特性使用、性能提升、问题修复等功能。

操作场景

自动升级触发场景
场景一:当 CKafka 版出现重大 bug 或者安全漏洞时,系统会在您的维护时间内发起内核小版本的升级,并提前通过站内信、短信等方式推送升级通知。
场景二:当 CKafka 版发生触发集群迁移的操作(例如升配集群规格、扩缩容磁盘容量、CKafka 版本升级等)时,系统会将您的集群升级至最新内核小版本。
手动升级场景
除自动升级场景外,用户可自主在控制台手动升级内核小版本。

约束与限制

仅专业版实例支持升级实例内核小版本。
支持低版本实例向高版本升级,不支持降级兼容版本。
实例的小版本升级,系统会自动检测,不支持自定义目标版本。
实例兼容版本升级,不涉及费用变更。

升级影响

单副本 Topic 情况下,由于缺乏冗余备份,升级期间将导致该 Topic 完全不可用,无法进行任何消息生产或消费操作,从而引发业务中断风险。
多副本 Topic 情况下,升级过程能够保持服务连续性,但是需要逐个重启节点,负载会转移到其他可用节点上。因此建议将升级操作安排在业务流量较少的时段执行。
升级过程会逐个升级节点,每个节点的升级包含两个关键阶段,升级软件包和数据同步。单节点升级耗时 = 节点升级软件包耗时 + 数据同步耗时。
升级软件包:耗时约5分钟。
同步数据:取决于软件升级期间其他节点 Leader 副本产生的数据量,数据规模越大,同步耗时越长。
升级期间监控进程会因节点滚动重启而部分丢失或暂时中断,造成监控数据不准确或断点,待节点重启后监控数据将恢复正常。
升级期间由于节点滚动重启会引发分区 Leader 重新选举,会发生秒级连接闪断,通常在网络稳定的情况下 Leader 切换时长不超过1分钟。为确保多副本 Topic 服务的可靠性,建议在生产客户端配置重试机制:
对于使用 Kafka 开源客户端的场景,应检查 retries 参数配置,推荐设置为3-5;
对于 Flink 客户端环境,需确认是否已配置合适的重启策略。

前提条件

CKafka 实例的状态为“健康”时,才能升级实例内核小版本。

操作步骤

1. 登录 CKafka 控制台
2. 在左侧导航栏单击实例列表,单击目标实例的 “ID/名称”,进入基本信息页。
3. 基本信息模块,单击实例版本右侧的升级版本,设置好升级时间。

当前版本:当前的内核版本。
目标版本:默认升级到最新 Broker 版本,系统会自动检测小版本,如果小版本升级按钮无法选择,表示该实例已经是最新的小版本。内核小版本之间的差异,可查看 Broker 版本升级记录
执行时间:可以选择立即执行或者自定义时间(可选未来24小时内的任意时间),建议选择业务低峰期进行。
4. 单击确定,提交升级任务。
5. 在页面左侧选择事件中心页签,可以看到一条升级实例版本的记录。

6. 单击该记录操作列的查看详情,可以查看详细的升级任务进展。

7. 回到实例列表页面,可以看到实例的状态变为变配中,同时可以看到升级进度。
8. 实例变配中,建议您不要操作 Topic 管理及智能运维下的相关功能,避免引起非预期异常导致变配失败。