企业IT数字化转型中的PaaS运维模式

运营平台建设的背景

企业数字化转型已成为应对业务和市场不确定性以及新机遇的必备条件。在企业数字化转型的过程中,一个稳定且持续生长的运营平台显得至关重要。

为什么企业需要建设一个稳定且持续生长的运营平台呢?总结起来有如下三大背景原因:

1

外部环境的变化

随着外部市场变化,业务对IT的要求更为敏捷;同时,IT技术架构的发展与变化也是日新月异,开发运维一体化、敏捷交付、统一运维、智能运维等技术的成熟,对企业的运维和运营技术提出了更高的效率要求;

2

内部运营的变化

企业的技术栈越来越多、IT规模越来越大、运维和运营场景个性化进一步增强、运维安全和敏捷性同步要求等,同时也对企业内部提出了运维到运营能力建设的要求;

3

技术先进性需求

运维大数据、运维智能化等技术的发展与成熟,能给运维质量和水平带来飞跃的提升,适应公司信息化发展要求,迫切需要信息运维服务支撑系统向自动化、智能化方向迈进和发展。

运营体系的建设是一个复杂而庞大的话题,它涉及数字化驱动、技术引领、组织转型、重塑体验等多个内容。本文着重从技术角度来看一个运营平台建设的能力池,以及为什么只有PaaS化的运营平台建设模式,才能帮组组织实现真正的运营升级。

运营平台PaaS化特征

运营平台是支撑业务架构运行的平台,从本质上来讲运营平台应该独立于企业业务架构,但是又能对企业业务架构进行支撑与管理。

先列举一个概要的企业业务架构和企业技术运营架构的整体架构图和关联关系:

运营平台为什么要PaaS化?

1、企业业务类型是一个动态的过程,目前的业务类型和业务形态,以及未来的业务类型,不是一个特定和固定的模式,因而你无法通过设计2-3个功能模块解决当前和未来的运营问题;

2、技术的更新换代过于迅速,业务构建过程中,不会过多的从运营落地的视角来设计业务系统,而会把业务系统的架构、功能放在首位,开发语言、开发框架、操作系统、数据库等均不能作为业务开发的限制,新技术和技术栈的复杂使得运营系统构建要解决复杂而庞大技术适配问题;

3、业务操作单元暴涨,尤其是中大型企业,运营系统所要运维和运营的对象,少则数万个节点(服务器),多则数十万个节点,运营平台要足够支撑可持续扩展的操作单元,因而运营平台架构需要灵活水平扩展;

4、场景个性化,不同企业的运营流程、运营对象、运营操作几乎都是个性化的,运营平台构建解决场景的SaaS需要满足和覆盖个性化运营和运维场景,因而平台化和场景化是PaaS架构一定要考虑解决和适配的问题,不然无法支撑持续的运营生长。

很多时候我们都在谈平台化、大集中化、一体化,但是真正的PaaS,需要有明确的架构分层要求和功能定义。

那PaaS化运营平台应该是怎样的呢?

运营PaaS外部应该链接2个模块:

一个是运营的技术对象,业务应用以及基础架构;

第二个是运营的场景,这点非常能体现PaaS化的能力,场景的构建等同于PaaS之上SaaS的构建,运营场景应该是不受限于平台功能,而是由企业自己的运营和运维需求方提出,个性化落地。

同时,运营PaaS内部组件应该具备几个能力特征

1、具备运营所需的核心能力,且核心能力能持续扩展;能将核心能力和外部能力组装成能力池;

2、服务集成管理,将平台核心组件能以灵活的方式统一注册管理,并作为PaaS的能力对SaaS提供消费;

3、部署&运行托管能力,能更为便捷的提供SaaS开发所需的生命周期服务:开发、部署、运行、分析。

PaaS化运营平台概要架构层

整体设计应该具备如下特征

平台化设计:

打造承载所有运营功能的统一平台,平台具备接入资源层、运维服务能力提供和可承载自定义开发应用的能力,平台具备强大的延展性和服务支撑性;

技术领先性:

平台提供的IT运维能力服务,可持续延伸,可扩展至运维大数据模块、AI智能模块,通过平台发展的领先性保障功能和应用的领先性;

服务模块化设计:

将自定义开发应用所需的公共功能,进行服务化和模块化设计,沉淀于平台中,按标准ESB模式统一提供给应用功能开发;

功能工具化:

将所需的运维功能进行场景化,以工具化的方式运行在统一平台上,调用底层平台所提供的能力服务;实现功能敏捷迭代,功能之间不再以烟囱式方式构建。

PaaS化运营平台架构设计

我们再细化到运维和运营PaaS平台内部结构,请看,如下是一个PaaS逻辑架构设计:

平台服务能力池主要由三部分构成:

iPaaS能力:

提供对象接入,接入后的基本自动化管理,以及输出标准组件到ESB,解决自动化对象驱动的问题;

aPaaS能力:

提供开发辅助、APP运行、集成服务和接口管理的能力,解决自定义开发场景并运行的问题;

平台管理:

自身的身份、权限、审计管理和移动接入。

而运营场景建设则是一个敏捷迭代的过程:

1、利用平台的开发框架和服务能力,标准化和便捷的生成场景类自动化应用;

2、场景由运维人员自行定义、分析、开发和运营,采用敏捷开发模式逐步建设。

同时PaaS模式下的运营平台还能带来一个影响运营平台成功落地的关键:运维开发组织的培养。

传统组织下运维人员具备各个领域运维技能,保障技术设施运行稳定性,而面对业务更为敏捷和灵活的要求时,需要运维组织能够快速响应运营场景的需求,而借助于PaaS提供的运营场景开发服务,传统运维组织能够从保障稳定性上逐步提炼出更高的价值。

不同于业务系统的开发,运营场景的开发是运维人员进行运维开发转型后能足够胜任的,而且更懂运维与运营的是实际拥有维护经验的人,基于平台化的方式,使得运营场景的构建更为敏捷,组织能力得以整体提升。

蓝鲸研发运营一体化平台技术架构

蓝鲸智云,简称蓝鲸,是腾讯IEG事业部“腾讯智营”下的一个子品牌(网址:bk.tencent.com/)。蓝鲸是一套基于PaaS的技术解决方案,提供了完善的前后台开发框架、调度引擎、公共组件等模块,帮助业务的产品和技术人员快速构建低成本、免运维的支撑工具和运营系统;是腾讯互娱事业部沉淀多年的技术运营支撑体系,承担着数百款业务线上运营的使命。

我们可以从IEG事业群的业务特点,来探索腾讯互娱的运营平台是如何产生的:

1、腾讯IEG游戏运营所遇到的业务痛点:

有几乎所有的业务类型(重客户端游戏,网页游戏,各类官网,移动终端游戏,大型游戏平台)、所有业务之间无关联(几百款游戏相互之间是没有关系的)、有几乎所有的流行技术(腾讯游戏几百款业务中,大多数是由世界各地开发商开发出来。所使用的开发语言、开发框架、操作系统、数据库等技术,是没有直观规律的)、业务操作单元海量(服务器数量,也就是操作单元,有十余万)。

2、转型曙光:

平台原子化,抽象再抽象;蓝鲸设计思路:尽可能将单个步骤抽象为原子,再将原子自动化,而后通过任务引擎连接成“串”或者“树状分支结构”实现全自动化。这样做的优点在于:不依赖业务类型,不依赖架构,不依赖场景,只要运维手工能做的,都可以做成无人值守。

3、不断累积原子平台能力:

把各个运维和运营场景进行抽象,抽象出大部分典型场景都需要获取业务配置,和进行作业执行,这个时候,蓝鲸配置平台和作业平台就产生了,而抽象出来的这种原子平台就成为了PaaS能力池的能力块。

4、原子平台集成:

原子平台越建越多,但是原子平台最终都是用来消费和调用的,因而接下来进行整体集成,整体架构上用了SOA架构,而服务模块上则会灵活使用微服务架构。

5、平台化开发模式让运维应用自生长:

这个阶段则是真正的释放了运维,平台做好了,搭建服务SaaS开发生命周期的系统组件,使得运营场景可落地为SaaS进行自生长,最大规模时,蓝鲸平台上运行了1000多个SaaS服务于各个业务各个运维和运营场景,而这些场景都是运维人员做出来的。

6、自生长的运营平台,才能“完美解决”运维和运营的复杂性和多样性:

  • 支持多语言的开发框架;
  • SaaS免运维托管;
  • 企业服务总线统一集成;
  • SaaS运营数据可视化。

7、 最后形成的IEG事业群内部运营技术架构:

而持续的平台原子能力,和场景化的积累,使得一套运维体系得以成熟和完整,并拥有强大的技术领先型:

研发运营一体化体系架构描述:

1、管控平台层:

  • 负责通过agent、通用协议和API接口等方式公有云、私有云或者混合云中的服务器、存储、网络、虚拟化平台、数据库、中间件、基础应用、业务应用、云管平台、容器等企业所有需要统一运维和运营的IT资源进行纳管;
  • 为后续的统一运维管理提供操作基础。

2、原子平台层:

  • 原子平台层中的每个原子平台都是一个或者多个相关功能的集中;
  • 原子平台层包括以下各个原子平台: 配置管理平台(CMDB):企业所有IT对象配置信息的集中存储和消费中心 作业平台:针对IT对象进行脚本执行和文件分发层面的自动化编排的作业中心 容器平台:企业所有容器资源的管控和编排中心 数据平台:蓝鲸的大数据平台,针对运维和运营数据数据进行大数据接入、清洗、存储、实时和离线计算、展示以及数据消费的中心;实现数据运营的关键; 挖掘平台:针对运维和运营数据的智能AI挖掘中心;实现智能运维的关键; 移动平台:对接腾讯微信,实现蓝鲸移动运维的功能模块; DevOps平台:基于蓝鲸平台实现DevOps研发运营一体化的功能模块; 企业第三方系统:通过蓝鲸,可以集成企业内部现有的业务系统或者运维管理系统,实现整体IT运维运营自动化。

3、集成平台(核心PAAS层):

  • 集成平台包括: 原子平台层中的所有原子平台、企业服务总线(ESB)、API GateWay(统一接入模块)和开发者中心(提供前后端开发框架)。
  • 企业服务总线(ESB)+ API GateWay(统一接入模块): 将配置管理(CMDB)平台、作业平台等蓝鲸内部原子平台以及企业现有的第三方系统(例如AD、Exchange、ITSM、现有监控软件)统一接入、集成、驱动和调度,供上层运维场景APP驱动和调用。
  • 开发者中心(提供前后端开发框架): 开发者中心提供完整的前后端开发框架,当企业在未来出现新的监控和运维需求的时候,企业可以快速利用开发者中心完成相应的运维APP开发,并一键部署。

4、运维场景APP层(SAAS层):

  • 蓝鲸平台所有的运维场景APP运行在这个层次,包含IT监控等各类APP;
  • 该层次包含测试环境和生产环境两套运行环境;APP开发完整并部署后,先运行在测试环境,稳定后再推送到生产环境。

以上为笔者对运营平台建设的理解和蓝鲸技术架构的分析,欢迎探讨交流,谢谢!

原文发布于微信公众号 - 嘉为科技(canway_service)

原文发表时间:2018-10-22

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

扫码关注云+社区

领取腾讯云代金券