专栏首页大魏分享(微信公众号:david-share)从Gartner IT成熟度模型谈Linux运维

从Gartner IT成熟度模型谈Linux运维

前言

本文参考IT基础架构和运维成熟度模型中的技术项,探讨Linux运维相关内容。本文由我和我的另外两名同事一起完成。

从基础架构和IT运维成熟度模型谈起

Gartner提出的IT基础架构和运维成熟度模型,是用来帮助IT的管理者从四个维度评估他们的IT成熟度:人员、流程、技术、商业管理。并且Gartner把这四个维度的考量分别划分成六个等级。

在6个级别中,Level 0属于“石器时代”基本可以忽略。

从Level1到Level5,分别是:有感知的、认可的、主动的、服务型的、业务合作伙伴。

这样说起来,似乎还有有点不落地,我们拿一个维度的考察项举例,例如流程。

通过上图,读者就能比较清楚了解各个级别流程的情况有一些感性的认识了。需要指出的是,本文主要讨论的内容,是基于模型中的是技术维度,其余三个维度,不在本文讨论范围之内。

OS运维成熟度模型

参考Gartner IT基础架构和运维成熟度模型中的技术维度,我们根据在Linux领域长期的经验,提出OS运维成熟度模型。

这个模型主要是针对Linux运维的,同样分为5个Level。每个级别有5个参照项,分别是:Core Build管理、补丁管理、配置管理、告警和日志管理、安全和漏洞管理。

如果给每一个级别用通俗语言并并结合一个小故事进行描述,那么这个故事应该是这样的......:

级别1:没有标准

在“很久”以前,有一家公司成立了,名叫大卫公司,做房地产生意。老板大卫买了3台服务器支撑内部IT系统,由于公司规模很小,IT的工作由大卫自己承担。服务器到货以后,他给服务器上架加电,并安装了RHEL,并且在3个RHEL上安装了应用。到此处,IT的工作就OK了,先不用管它,卖楼是第一要务,IT有问题再说。

级别2:开始制定IT标准。

大卫公司成立以后,由于生意比较好,IT规模也迅速增加,不到2年,服务器数量从3台增加到了50台。因此,成立了IT部门并招聘了两名工程师。这时候,操作系统的安装就需要有标准了,否则相同版本的操作系统不同的人安装,由于安装模式不同,可能装的五花八门。这时候,补丁也需要关注了,采取的方式还是手工下载补丁包、手工打补丁。配置管理则是依据编写的文档手工修改。日志和告警需要手工检查,安全策略通过配置防火墙测试实现。这时候,随着内部IT业务系统规模和种类的增加,以前简单采购方式,已经无法满足大卫公司的业务要求了,因此大卫公司成立了IT研发部门。

级别3:关注标准的执行

大卫公司运行了1年半以后,业绩翻了几倍。服务器数量从50增加到100台。这时候,为了提高服务器的利用率,大卫公司又买了RHEV虚拟化软件,并且将虚拟化整合比设定为1:8左右。也就是说,总共的RHEL操作系统数量在800左右。

这时候,IT顿时感到工作量巨大。此时,操作系统安装就需要从手工安装转化为自动化安全。而补丁管理需要使用yum源。配置方面,则需要使用批量脚本进行批量执行。定期巡检也要搞起来了。安全漏洞则需要定期扫描。

在这个阶段,大卫公司制定的IT标准已经完善,大卫也要求IT运维部门严格执行。

级别4: 关注执行过程中产生记录,统一管理

又过了三年,大卫公司的业绩又翻了几倍。操作系统数量已经突破2000。这时候,开发和生产环境中操作系统的版本已经比较多了,需要做操作系统版本管理。而补丁管理,也需要集中管理。配置管理则需要在级别3的批量脚本执行上,使用git或SVN进行统一管理。告警和日志也需要做集中管理,把操作系统和应用日志做统一收集和分析。安全漏洞方面,也需要做集中管理,以提高效率,避免出错。

级别5.实现开发运维一体化

又过了两年,大卫公司由于业绩太好,决定IPO,并且成功上市。这时候,该公司操作系统数量已经超过5000,应用类型几十种。上市以后,由于竞争非常激烈,老板大卫要求研发部门提升产品的研发速度。新产品的发布速度需要从6个月缩短到1个月。这时候,在大卫的安排下,开发部门和运维部门大佬们坐在一起,研究如何将devops落地。通过不断的学习和探索,devops在该公司实施成功,系统版本使用容器技术进行分层管理。补丁管理、配置管理、日志告警、安全漏洞的管理均实现了自动化。Devops在大卫公司成功落地以后,大卫公司竞争力大幅提升。

红帽卫星对于OS成熟度模型的意义

在OS成熟度模型中,大多数客户处于级别二到级别三的转化中。而红帽卫星,是能帮助客户将OS运维成熟度模型提到到四级(以红帽卫星为主,结合开源工具ELK)。而从四级到最终第五级的Devops,则需要OpenShift解决方案以及Ansible等工具。

红帽卫星

本文前半部分讨论了,如何通过GartnerIT基础架构和运维成熟度模型中的技术维度,引出OS成熟度模型,并且介绍了每一个等级的具体情况。那么,对于一个客户而言,红帽如何帮助客户提升OS运维成熟度级别?

这时候,找红帽卫星啊!(Red Hat satellite)

红帽卫星这个听起来很拉风的名字,除了可以帮助客户提升OS运维成熟度。还是红帽SOE架构的落地工具。SOE全程是Standard OperatingEnvironment,意思是标准操作环境,也就是将生产运维实现标准化。至于标准化的意义和好处,读者应该都比较了解了。

IDC 2014年发布的白皮书The Business Value of Standardizing on Red Hat

Infrastructure Solutions,里面谈到,通过在数据中心实施红帽标准化方案,不仅可以大幅降低IT基础架构的复杂度,还会带来巨大的收益、大幅降低TCO。

  • Optimizing Linux serverinfrastructure costs — saving $3,566 per 100 users per year Enhancing IT staffproductivity — lowering the labor costs of supporting services by $3,318 per
  • 100 users per year whileimproving IT services quality
  • Driving end-user productivityby delivering more reliable operational performance — adding
  • $2,319 in value per 100 usersper year
  • Increasing businessproductivity — lowering operations costs and adding new revenue totaling
  • $2,345 per 100 users per year

Satellite到底是什么?

可能很多读者对VMware的产品解决方案比较熟悉,我们可以大致将它和VMware的方案进行对比,以方便理解。

红帽Satellite=vCenter中的license管理+UpdateManager + VMware Configuration Manager+ vROps中的安全加固手册。

那么在Linux运维管理方面,Satellite具体能做什么?

  • 自动部署

目前很多客户采用各种开源技术实现了操作系统的批量安装和自动化部署、但是先前的做法可重复利用化程度很低,每当有项目需要进行自动部署时都需要针对该项目重新进行配置,工作量大且效率低下而且没有很好的版本管理和回退机制,也缺乏一个很好的管理界面来进行管理,希望通过有效的管理工具来实现快速部署海量服务器的问题。

  • 软件更新

目前行里的服务器升级都是去红帽官方网站下载然后手工进行升级操作,实效性、可追溯性差,管理员只是被动接收来自安全部门和红帽的安全建议,希望通过一个集中展示平台,直观的看到行内所有linux服务器目前运行的软件版本和官方版本之间的差异、升级的类型并直接通过统一的展示界面远程直接对需要升级的服务器升级某一个软件的升级程序。

  • 安全更新

国家现在对开源软件的安全性要求很高,很多行业客户的安全部门以及公安部会定期对所有的Linux服务器进行安全扫描并发布安全整改意见,这些意见和厂商提供的安全更新建议往往有很大的出入,迫切的需要一个工具能提供红帽产品的安全更新以及修复建议并且能结合上述的软件更新功能为系统及时的修补安全漏洞

  • 合规性检查

很多IT规模比较大的客户有自己的操作系统基线,定义了一系列的标准,这些标准需要人工来实现以及更,参与Linux运维的人员也很多,每个人的能力、对操作系统的理解程度以及使用习惯的不同会造成Linux服务器的配置存在很大的差异,有无可能通过一个集中式管理工具结合行里的运行规范来实现自动化部署并且可以根据已有古规范找出个与规范之间的差异并消除

  • 从开发到测试到运维的软件生命周期管理

很多客户的开发测试运维的环境都不完全一样,这就有在开发测试环境中可用但到了生产环境会出现问题的风险,希望通过工具来统筹管理开发、测试和运维平台上的Linux环境的部署,应用软件的分发以及合规性一致性的检测。

  • 多用户、用户组管理以及访问控制

很多客户基于Linux的系统都是以项目(业务)的方式进行划分的,每个项目都会有相应的软件中心和数据中心的技术人员负责应用软件和操作系统的开发、部署、上线、维护等工作,为了完成这些工作需要给相应的用户赋予相应的权限以避免越权操作,希望解决在大规模Linux使用环境下用户管理和权限划分的问题。

  • 服务器组批量操作

传统的Linux运维管理需要登录到服务器上手工或者通过执行脚本的方式来进行,对于一个项目而言,通常几台甚至几十台服务器的配置和运行环境是完全一样的,希望能实现像操作一台服务器那样操作一组服务器,执行一次操作就可以对该组内所有服务器都生效,即对一组服务器可批量进行升级、部署、管理和维护的工作。

总结:

截止到目前,相信大家对OS成熟度模型的相关概念有了一些了解,在后续的文章里,笔者会根据读者的反馈,做更深一步的介绍。

本文分享自微信公众号 - 大魏分享(david-share)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2016-06-26

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 构建数据中心一体化运维平台:小型机篇

    大卫说:关于构建自动化运维平台的相关内容,此前本公众号已经分享过很多篇文章,如: 大卫的思考 | 金融行业自动化运维的研究和落地 Ansible Tower管理...

    魏新宇
  • 从PowerVM,KVM到Docker:存储池的配置与调优---第一篇(第2子篇)

    Shared Storage Pool 的维护管理 Shared Storage Pool 的概念 共享存储池是一个 SAN 存储设备的池,这些设备可以跨多个 ...

    魏新宇
  • 用户身份验证的几种方式以及OpenStack认证方式的使用

    笔者在加入VMware之前,做UNIX技术支持工作将近8年。由于UNIX服务器通常在数据中心内部,与外网隔离,因此用户身份认证通过比较简单。即密码验证。后来接触...

    魏新宇
  • DOIS大会参会总结和思考

    上周去参加DOIS(DevOps International Summit,缩写:DOIS)会议。除了自己的分享外,也看了一些其他公司当前在做的事情,谈谈个人的...

    赵成
  • 关于运维智能化观点

    最近好几个朋友和我聊传统金融行业中的运维智能化,如果用gartner创新曲线来映射我对智能化位置的定位,我觉得在传统金融行业中智能运维现在处于期望膨胀期与泡沫破...

    彭华盛
  • 构建面向IT性能的运维组织

    在复杂的IT运维组织事务活动中,如何确定IT运维的目标,对于很多运维组织来说也是一个难点。有些运维组织用的是稳定性/可用性/质量的指标,有些团队用的是效率,有些...

    用户1593318
  • 为什么我说未来10年是AI和运维的天下

    嗯,对于每个要就业的人来说,这个确实是一个很重要的问题。我们总希望找一个好的方向,然后一干一辈子。不论这个愿望是不是最终能够实现吧,至少转行的成本越低越好。

    刀刀老高
  • 互联港湾张永波:增加运维服务广度、深度,为用户提供全方位保障

    港湾人儿
  • 2018年724运维日视频回顾:如何运用新技术助力银行传统IT运维向金融科技转型

    7月22日,2018深圳站7.24运维日特别活动在腾讯大厦举行,此次活动由腾讯蓝鲸智云主办、嘉为科技承办,大会围绕“运维人的远方,蓝鲸与你同行”的主题,分享交流...

    嘉为科技
  • Zabbix告警升级机制图文详解

    简单的配置第个,剩下的配置类似,重点不在于如何配置这个,重点在于如何配置“告警升级”和发送时间的理解

    张琳兮

扫码关注云+社区

领取腾讯云代金券