TCE(Tencent Cloud Enterprise),腾讯云企业版,基于腾讯公有云成熟产品体系推出的企业级云平台,为企业提供自主可控、弹性伸缩的全栈服务能力。
云管平台是TCE的门面,是客户使用TCE的界面,不可或缺。云管平台主要包括租户端(管理与审计)和运营端(平台运营、平台运维、平台管理),其中租户端为租户提供IaaS/PAAS/SAAS资源使用/监控等能力,运营端为运营管理员提供完整的管理能力,包括账号/鉴权/流程/审计/计费/报表等,以及IaaS垂直产品运维/专有云底座运维等。
运营端:
租户端:
当前TCE整体技术架构如下图,其中云管平台紧密连接底座、IAAS/PAAS产品与各类用户,功能上覆盖基础平台(TCenter)、运营平台(BSP/BMPPro)及运维平台(OSP/OSPPro),基础平台能力主要覆盖账号、权限、网关、密钥等。
客户诉求两端基础平台产品能力与体验保持一致?
统一两端基础平台产品能力与架构
运营端基础平台为TCE侧从0到1迭代,租户端基础平台来自公有云自研,运营端平台产品能力、安全合规能力滞后于租户端。
综合考虑,重点补齐运营端缺失的特性,同时完善两端安全合规及定制化能力。
如何快速对齐两端能力?
首先考虑两端能否各自独立迭代,长期来看不可持续;然后考虑两端能否选择性重写服务,这要求非常熟悉两端且需考虑各种现网兼容,成本其实也不低;最后考虑能否用租户端代码同时服务两端,需要注意两端实际功能场景不完全一致,需要各自定制开发维护特性;某些定制化组件如文档、消息考虑彻底重构。
大版本初期需从租户端最新tce分支拉新分支for运营端,大版本末期需要评估租户端改动是否能合入运营端
每个大版本,运营端总是与租户端共用TCE分支,改动需评估是否兼容两端,对定制化需求需加配置开关
综合对比考虑,最终选择两端共用分支,通过配置开关维护定制化特性。
效果分析 | 之前 | 对齐后 | 效果 |
---|---|---|---|
产品能力 | 1、运营端缺角色,不支持多点登陆… 2、租户端不支持子账号配额,无菜单鉴权… | 1、运营端补齐缺失的平台产品能力 2、租户端完善了产品能力 | 1、拉齐了两端平台核心产品能力,部分改动回合租户端 2、垂直FT接入两端体验一致,接入耗时降低50% |
架构能力 | 运营端部分组件逻辑耦合 | 1、组件逻辑不再耦合 2、运营端控制台核心流量切换到新架构,改造旧架构逻辑兼容周边组件调用 | 1、对齐了两端组件架构 2、跨部门团队拉通产品、前后端、测试 |
客户价值 | 1、两端体验不一致 2、安全合规能力不完善 | 1、两端体验一致 | 1、增强安全合规能力 2、完成现网平滑升级 |
人力消耗 | 运营端4人,租户端3人+公有云平台产品中心支撑 | 两端人力互备,一端改动两端同时生效 | 1、两端总共需3~5人 2、研发与运维人力互备,共享共建 |
长期收益 | 项目驱动开发,无整体规划,无法持续演进迭代 | 有roadmap,考虑长期发展方向,平衡好迭代节奏 | 为后续逐步推动云原生、微服务化、性能优化及稳定性改造清理障碍 |
本文针对客户侧和TCE云管平台内部演进诉求,回顾对比了TCE基础平台两端能力现状,确认使用租户端代码最终做到一份代码两端配置同时服务于两端,明确了整体演进迭代思路,确认了共用分支的策略,针对升级场景面临的挑战给出详细的应对策略,最后对比分析了改造前后的变化及收益。
当前基础平台大部分组件来自公有云,粒度拆分太细,导致平台服务调用链很长,排障困难,消耗大量物理资源,需要考虑专有云场景下是否有必要继续保持当前的拆分粒度,可以考虑进行适当的整合重构,增强云管平台的集成与被集成能力。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。