首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >TKE AppFabric:全生命周期高可用的云原生应用平台

TKE AppFabric:全生命周期高可用的云原生应用平台

原创
作者头像
IT资讯研究所
发布2026-05-30 20:06:04
发布2026-05-30 20:06:04
110
举报

数据来源: 2024 腾讯全球数字生态大会 (Tencent Global Digital Ecosystem Summit)

主讲人: 何鹏飞

一、 产品定位与核心亮点

TKE AppFabric 是腾讯云推出的全生命周期高可用的云原生应用平台。该产品旨在解决传统面向集群管理应用时的稳定性与灵活性痛点,通过“面向可用区部署”“应用声明式编排”,将应用管理从底层集群资源中解耦,提供应用管理的稳定底座与灵活引擎

二、 产品应用场景

针对当前云原生应用管理中的核心瓶颈,TKE AppFabric 主要服务于以下业务场景:

  1. 多集群容灾与资源调度场景
    • 痛点: 应用创建时难以控制资源在不同物理位置的分布比例,不满足容灾要求;应用维护需随集群资源动态变化而被动调整。
    • 受众: 对高可用性有严格要求的业务方(如金融、医疗、核心交易系统)。
  2. 集群资源利用率优化场景
    • 痛点: 集群利用率低,升级、下线等操作对上层用户有感知;单集群资源不足导致需动态调整部署集群。
    • 受众: 关注基础设施成本与效率的运维团队。
  3. 复杂的应用运维与观测场景
    • 痛点: 管理大量 K8S 资源门槛高,资源间缺乏统一归属关系;资源分散在多个集群,难以统一观测和控制。
    • 受众: 研发与运维人员,特别是需要频繁进行灰度发布和流量管理的团队。

三、 应用框架和功能介绍

1. 功能框架

TKE AppFabric 将应用定义为一系列 K8S 资源对象的集合(如 Subscription、Globalization、Load、Service、Configmap、HPA 等),通过抽象层屏蔽底层集群差异。

2. 核心能力模块

基于平台特性,核心功能包含以下维度:

功能维度

核心能力描述

多可用区容灾

支持可用区动态选择、指定可用区部署,实现多可用区容灾

服务高可用

提供全生命周期的应用高可用能力,基于最佳实践增强应用稳定性。

多集群引擎

统一集群接入与舰队管理,支持集群标准化、基于特征的分组及资源差异化分发与容量再均衡

流量管理

支持多集群四/七层接入就近访问

应用标准化

提供资源编排模板与部署策略模板,支持插件标准化与批量管理。

可观测性

提供拓扑可视化增强的工作负载视图,支持应用级状态管理。

3. 硬核指标与特性

  • 部署模式: 支持按可用区拓扑调度(单集群多 zone 模式)。
  • 资源分布: 支持指定副本在可用区的分布比例(等比例、指定比例、按容量)。
  • 容错能力: 支持设置容忍度,提升容错率;支持Pod 数量可容忍
  • 扩展性: 支持可用区个数可扩展
  • 发布策略: 支持变更分批灰度发布(如按可用区灰度)。
  • 接入能力: 支持多重集群类型接入。

4. 产品优势

  • 资源分布优化: 更符合用户资源位置要求,集群资源共用,集群利用率更高
  • 用户无感运维: 应用不直接感知集群,集群维护用户无感
  • 精细化感知: 具备精细化的资源容量感知能力
  • 低门槛使用: 仅需学习应用如何编排,使用门槛低;声明式编排符合云原生规范。
  • 应用视角管理: 更接近应用维护场景,易于观测、运营,管理性更强

5. 荣誉背书

  • 文中未提及具体奖项或第三方认证信息。

四、 典型案例

案例一:腾讯健康

  1. 背景: 需要实现高可用的服务架构,确保应用(如 app1, app2, app3)在多个可用区(zone1, zone2, zone3)稳定运行。
  2. 解决方案: 利用 TKE AppFabric 的多可用区部署架构,通过 Gateway 将流量分发至不同可用区,实现应用的多副本跨区部署。
  3. 成效: 实现了基于多可用区(zone1/2/3)的应用高可用架构支撑。

案例二:云腾讯云 CLS (日志服务)

  1. 背景:
    • 饱受资源短缺困扰:单集群资源不足,需动态调整部署集群和资源副本量。
    • 难以有效高可用部署:集群拓扑位置不可控,难以控制应用副本比例,容灾能力受限。
    • 应用管理效率低:资源分散在多个集群,难以统一观测和控制。
  2. 解决方案:
    • 容灾部署: 使用平台多可用区部署能力,指定3可用区等比部署。
    • 路由控制: 基于平台内置的北极星服务,配置可用区级就近访问,实现正常情况下流量可用区内闭环,异常情况下跨可用区容灾。
    • 灰度发布: 使用平台内置的按可用区灰度发布能力,先在单可用区发布以降低风险。
  3. 成效: 解决了资源短缺与拓扑不可控问题,实现了跨3个可用区的高可用容灾部署与精细化流量管理。

五、 产品路线图 (Roadmap)

  • 2024 Q1-Q3: 内部打磨,服务腾讯内部自研上云。
  • 2024 Q4: 邀测阶段,对限定用户开放;进行可选功能插件化改造。
  • 2025: 正式发布(GA)。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、 产品定位与核心亮点
  • 二、 产品应用场景
  • 三、 应用框架和功能介绍
    • 1. 功能框架
    • 2. 核心能力模块
    • 3. 硬核指标与特性
    • 4. 产品优势
    • 5. 荣誉背书
  • 四、 典型案例
    • 案例一:腾讯健康
    • 案例二:云腾讯云 CLS (日志服务)
  • 五、 产品路线图 (Roadmap)
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档