前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >[云原生]云原生容器理论和落地实践

[云原生]云原生容器理论和落地实践

原创
作者头像
宇宙无敌暴龙战士之心悦大王
修改2023-03-24 10:17:08
6930
修改2023-03-24 10:17:08
举报
文章被收录于专栏:kwaikwaikwai

一、序章

本文会详细介绍vivo在容器集群高可用建设中的具体实践,包括在容器集群高可用建设、容器集群自动化运维、容器平台架构升级、容器平台能力增强、容器生态打通等层面的打磨和建设。目前,vivo容器产品能力矩阵逐渐趋于完善,并将围绕全面容器化、拥抱云原生和在离线混部三个方向继续发力。

云原生和容器,是当下比较火热的话题,其中 Kubernetes更是成为容器编排领域的事实标准。

国内外各企业在内部落地云原生和容器的过程中,基于自己的业务场景和发展阶段,会遇到各种问题和挑战,本文是vivo在云原生容器领域的探索和落地实践,希望能对读者有一些借鉴和帮助。

二、容器技术和云原生理念

首先是容器技术和云原生理念的介绍。

1.1 容器技术简介

容器技术不是一个新技术,从1979年unix系统的chroot诞生到现在,历经40多年的发展,共经过了四个阶段,分别是:技术萌芽期、技术迸发期、商用探索期和商用拓展期

每个阶段,解决了不同的技术问题,分别是:环境隔离、软件分发和编排、商用服务形态、规模化和场景拓展。

相比于虚拟机,容器技术少了一层虚拟操作系统的损耗,因此它比虚拟机具有更好的性能表现。另外容器在系统资源、启动时间、集群规模、高可用策略等方面,也有非常明显的优势。

2020年CNCF中国云原生调查报告显示,接受调查的中国企业,有68%已经在生产环境使用容器技术。

从行业发展看,不管是云厂商还是各大科技公司,都在基于容器技术构建自己的新一代基础架构,推动企业数字创新。容器技术已经得到广泛的认可和普及。

1.2 云原生理念介绍

图片
图片

容器技术催生了云原生思潮,云原生生态推动了容器技术的发展。那么云原生的准确定义和含义是什么呢?

云原生其实没有标准定义,如果非要给他一个定义,行业有两种观点:

  • 一个定义来自Pivotal 这家公司,它是云原生应用的提出者,是云原生的先驱者、探路者。Pivotal最新的官网对云原生的介绍有四个要点,分别是:DevOps、持续交付、微服务和容器
  • 另外一个定义来自CNCF,CNCF建立于2015年,它是一个开源组织,其存在的目的,是支持开源社区开发关键的云原生组件,包括 Kubernetes、Prometheus监控等。

它把云原生分为3种核心技术2个核心理念

  • 3种核心技术:分别是容器、微服务、服务网格
  • 2个核心理念:分别指不可变基础设施和声明式API

但是,不管是那一种定义,容器都是其基础,是云原生落地的核心技术手段。

1.3 云原生价值分析

图片
图片

任何技术和理念,都必须有实际的业务价值。从效率、成本、质量三个维度,来分析云原生和容器的技术价值,可总结如下:

  • 效率:可实现持续交付部署快、镜像封装可移植、弹性计算秒扩容。
  • 成本:可实现按需分配不浪费、统一调度高填充、混合部署少碎片。
  • 质量:可实现运行状态可观测、故障发生可自愈、集群管理可运维。

三、vivo 容器技术探索与实践

新技术的引入带来新的价值,也必然会引入新的问题,接下来介绍vivo在容器技术上的探索和实践。

2.1 试点探索

图片
图片

在vivo的算法场景中,机器学习平台负责算法模型迭代,是互联网算法业务中核心的一环,早期的平台基于传统的架构,在效率、成本、性能和体验上均有一定的不足,无法满足算法业务快速增长的诉求。基于此,我们首先在算法场景进行容器的试点探索。从2018年开始,我们以容器作为基础底座,打造了vivo的一站式云原生机器学习平台,向上支撑了公司的算法中台,为算法工程师提供数据管理、模型训练、模型管理、模型部署等能力,为广告、推荐和搜索等业务赋能。

vivo的云原生机器学习平台具备如下5大优势:

  • 场景全:业务端到端,覆盖推荐、广告、搜索多场景。
  • 体验好:排队时间短,用户体验优,任务P99排队时长小于45分钟。
  • 成本低:调度能力好,资源利用率高,CPU利用率均值大于45%。
  • 效率高:网络规模大,训练跑得快,训练速度8.3亿样本每小时。
  • 结果优:算法迭代稳定,训练成功率高,训练成功率大于95%。

vivo云原生机器学习平台,成功为算法实现了降本、提效,让云原生和容器价值初露锋芒。

2.2 价值挖掘

图片
图片

基于前面机器学习平台的试点成果,我们深入分析和挖掘容器和云原生的价值,结合vivo的情况,我们发现容器和云原生是企业大规模降本和提效的最佳方案。

1)在降本方面

当前我们内部服务器资源的利用率较低,以CPU利用率为例,当前vivo服务器整体利用率均值在25%左右,相比行业一流水平的40%~50%,还有不少的提升空间。

容器在资源隔离、统一调度和在离线混部等方面的优势,均是提升资源ROI的有效技术手段。

2)在提效方面

当前我们在中间件版本升级、机器迁移、测试环境管理、突发流量应对和全球化部署的环境一致性等方面均有业务痛点。

容器的快速交付、弹性自运维、微服务、服务网格等云原生技术和架构,则是提效的有力措施。

2.3 战略升级

图片
图片

经过算法场景的试点实践和价值分析,我们对内部战略做了升级, 确定基于云原生理念去构建行业一流的容器生态,实现规模化的降本提效目标。

为了更好匹配战略落地,拥抱云原生,我们还对内部技术架构重新规划和升级,新增引入统一流量接入平台、容器运维管理平台、统一名字服务、容器监控等平台和能力,支撑容器生态在公司内部的全面建设和推广。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、序章
  • 二、容器技术和云原生理念
    • 1.1 容器技术简介
      • 1.2 云原生理念介绍
        • 1.3 云原生价值分析
        • 三、vivo 容器技术探索与实践
          • 2.1 试点探索
            • 2.2 价值挖掘
              • 2.3 战略升级
              相关产品与服务
              容器服务
              腾讯云容器服务(Tencent Kubernetes Engine, TKE)基于原生 kubernetes 提供以容器为核心的、高度可扩展的高性能容器管理服务,覆盖 Serverless、边缘计算、分布式云等多种业务部署场景,业内首创单个集群兼容多种计算节点的容器资源管理模式。同时产品作为云原生 Finops 领先布道者,主导开源项目Crane,全面助力客户实现资源优化、成本控制。
              领券
              问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档