三种集群模式对比

模块 | 特性 | CDC 托管集群 | 公有云集群 | CDC 独立集群 |
Cluster 集群 | TKE Kubernetes 控制面位置 | 腾讯云区域 | 腾讯云区域 | CDC |
| TKE Kubernetes 版本支持 | 支持 | 支持 | 支持 |
| TKE Kubernetes 控制面可用性 | 支持 | 支持 | 需要客户保障三个控制平面实例 |
| TKE 控制面自动升配 | 支持 | 支持 | 不支持 |
| TKE 用户使用界面-CLI/API/Terraform/控制台 | 支持 | 支持 | 支持 |
| TKE 集群规格L5-L5000 | 支持 | 支持 | L20/L500/L300 |
| TKE 集群网络模式 | support GlobalRouter support VPC-CNI | support GlobalRouter support VPC-CNI | GlobalRouter |
| TKE Master 与 Node 网络联通性 | 依赖 CDC 子网与 TKE Endpoint 网络云联网或双向 VPN 打通 | 连通 Connected | 连通 Connected |
| TKE 集群网络 IPv4&IPv6 双栈 | 不支持 | 支持 | 不支持 |
| TKE CPU 架构 | x86 | x86 & ARM | x86 |
| TKE 控制面组件 Kubernetes 版本升级 | 支持 | 支持 | 支持 |
| TKE 控制面组件监控、日志、审计、告警 | 支持 | 支持 | 支持 |
| TKE Kubernetes 访问入口 - 公网 | 支持 | 支持 | 支持 |
| TKE Kubernetes 访问入口 - 内网 | 支持 | 支持 | 支持 |
| 腾讯云 KMS 加密 Kubernetes Secret | 支持 | 支持 | 支持 |
| Kubernetes API Server 身份验证 | 支持 | 支持 | 支持 |
| Kubernetes 集群备份&恢复 | 支持 备份到云上对象存储 | 支持 | 支持 |
Node 节点 | worker 节点支持型号、存储支持型号、镜像支持类型 | CDC 上 CVM/CBS 等产品型号 | 公有云 CVM 型号 | CDC 上 CVM/CBS 等产品型号 |
| worker 节点支持功能 | 普通节点 | 普通节点、超级节点、原生节点 | 普通节点 |
Component 组件 | TKE 支持的组件类型 | 支持, 部署在 Worker 的组件调用云 API 时依赖 CDC 与公有云网络的质量 | 支持 | 支持, 部署在 Worker 的组件调用云 API 时依赖 CDC 与公有云网络的质量 |
TKE for CDC 托管集群
TKE for CDC 托管集群功能介绍

使用 TKE for CDC 托管集群,Kubernetes 控制平面在腾讯云区域中运行。需要保障从 CDC 到腾讯云区域的可靠、冗余网络连接。网络连接的质量对于此选项至关重要。Kubernetes 处理 Kubernetes 控制平面和节点之间的网络断开连接的方式可能会导致应用程序停机。使用托管集群模式,您还可以节省 CDC 的容量配置。
TKE for CDC 托管集群控制平面功能完全等同公有云 TKE 标准集群。
支持L5/L20/L50/L100/L200/L500/L1000/L3000/L5000规格集群,并支持自动升配。
支持腾讯云公有云全部地域。
支持 VPC-CNI/Globalrouter 两种网络模式。
提供与公有云相等的服务协议保障,三可用区区域99.95%。
支持节点池、添加已有节点等功能。
TKE 托管集群架构说明
Master 托管模式:所有租户的托管集群的管理面(Master 、etcd)全部作为服务由 Kubernetes 集群维护,稳定性更高、扩展更简单。适合一般业务或集群规模变化比较频繁的场景。

利用 Kubernetes CRD 机制编写插件 Master-operator。
声明式 API 解决一致性问题。
每个 Kubernetes 集群在 MetaCluster 中占用一个 namespace。
Deployment 支持快速扩容、滚动升级和健康检查。
基于负载和 OOM 事件做 Master 自动扩容。
Pod Pending 事件自动触发 MetaCluster 节点扩容。
统一的日志、监控、告警。
TKE for CDC 托管集群,CDC 与公有云 Master 网络链路
实现 CDC Node 与云上 TKE 控制面互访通过 VPN 打通数据面。

红色链路:通过 VPN 打通节点与控制面的通信,Kubernetes 采用中心辐射型(Hub-and-Spoke)API 模式,所有从节点发出的 API 调用都终止于 apiserver。节点和节点上运行的 Pod 到控制面的连接默认即是安全的。
蓝色链路:通过 VPN 打通控制面与节点的通信,用于获取 Pod 日志、通信 kubelet 等场景,对该链路连接 TKE 默认提供安全认证。
TKE for CDC 托管集群注意事项
1. TKE 云上控制平面与 CDC 之间强依赖网络质量保障。如本地网络与腾讯云失去连接,您可以继续在 CDC 上使用本地 TKE 集群,但无法通过腾讯云控制台或 API 操作 Kubernetes 集群。恢复连接之前 Kubernetes 集群内各组件访问腾讯云中心云 API 亦会受影响,如 CBS-CSI 创建 CBS 持久卷的生命周期管理依赖云 API 调用。
2. Tencent Container Registry 在腾讯云中心区域运行,而不是在 CDC 环境,推送拉取容器镜像强依赖 CDC 与腾讯云直接网络链路质量。在网络断开期间,您无法访问公有云镜像仓库 TCR 服务,为了启用工作负载的创建、更新和扩展操作,应用程序的容器镜像须可通过节点缓存访问。如果您通常从云中的 TCR 中提取应用程序的容器镜像,请考虑运行本地缓存或本地镜像仓库。
3. TKE 集群的可用性与集群 Pod、ConfigMap、CRD、Event 等资源的数量、以及各类资源的 Get/List 读操作 QPS、Patch/Delete/Create/Update 等写操作 QPS 密切相关,应尽量避免对资源数量较多的集群发起类 List 操作,避免把 TKE 集群当数据库使用,写入过多的 ConfigMap/CRD/EndPoints 等,影响集群可用性。
4. 尽量避免与腾讯云上 CVM 和 CDC 内 CVM 混合使用,Pod 跨区域调度可能会存在云盘无法挂载、LB 流量转发等异常。混合使用建议仅限纯离线计算场景。
TKE for CDC 独立集群
TKE for CDC 独立集群功能介绍
使用 TKE for CDC 独立集群,Kubernetes 控制平面在 CDC 区域中运行。在临时、意外的网络断开连接期间实现稳定性和持续运行。

TKE for CDC 独立集群注意事项
1. TKE 独立集群在 CDC 上的您的账户中运行和管理 Kubernetes 控制平面。您无法在 Kubernetes 控制平面实例上运行工作负载或修改 Kubernetes 控制平面组件。这些节点由 TKE 服务管理。
2. TKE 独立集群需要在 CDC 上使用腾讯云存储服务 CBS。您的 CDC 必须有可用于 Kubernetes 控制平面存储的腾讯云存储服务 CBS。
3. TKE 独立集群的控制平面实例采用三节点以上高可用性拓扑设置,如果节点异常,请 联系我们,执行修复管理节点操作才能启用新的 master 实例。
4. TKE 独立集群使用 CAM 作为 Kubernetes 的身份验证机制,网络断开期间,CAM 不可用。
5. Tencent Container Registry 在腾讯云中心区域运行,而不是在 CDC 环境,推送拉取容器镜像强依赖 CDC 与腾讯云直接网络链路质量。在网络断开期间,您无法访问公有云镜像仓库 TCR 服务,为了启用工作负载的创建、更新和扩展操作,应用程序的容器镜像须可通过节点缓存访问。如果您通常从云中的 TCR 中提取应用程序的容器镜像,请考虑运行本地缓存或本地镜像仓库。