从Gartner IT成熟度模型谈Linux运维

前言

本文参考IT基础架构和运维成熟度模型中的技术项,探讨Linux运维相关内容。本文由我和我的另外两名同事一起完成。

从基础架构和IT运维成熟度模型谈起

Gartner提出的IT基础架构和运维成熟度模型,是用来帮助IT的管理者从四个维度评估他们的IT成熟度:人员、流程、技术、商业管理。并且Gartner把这四个维度的考量分别划分成六个等级。

在6个级别中,Level 0属于“石器时代”基本可以忽略。

从Level1到Level5,分别是:有感知的、认可的、主动的、服务型的、业务合作伙伴。

这样说起来,似乎还有有点不落地,我们拿一个维度的考察项举例,例如流程。

通过上图,读者就能比较清楚了解各个级别流程的情况有一些感性的认识了。需要指出的是,本文主要讨论的内容,是基于模型中的是技术维度,其余三个维度,不在本文讨论范围之内。

OS运维成熟度模型

参考Gartner IT基础架构和运维成熟度模型中的技术维度,我们根据在Linux领域长期的经验,提出OS运维成熟度模型。

这个模型主要是针对Linux运维的,同样分为5个Level。每个级别有5个参照项,分别是:Core Build管理、补丁管理、配置管理、告警和日志管理、安全和漏洞管理。

如果给每一个级别用通俗语言并并结合一个小故事进行描述,那么这个故事应该是这样的......:

级别1:没有标准

在“很久”以前,有一家公司成立了,名叫大卫公司,做房地产生意。老板大卫买了3台服务器支撑内部IT系统,由于公司规模很小,IT的工作由大卫自己承担。服务器到货以后,他给服务器上架加电,并安装了RHEL,并且在3个RHEL上安装了应用。到此处,IT的工作就OK了,先不用管它,卖楼是第一要务,IT有问题再说。

级别2:开始制定IT标准。

大卫公司成立以后,由于生意比较好,IT规模也迅速增加,不到2年,服务器数量从3台增加到了50台。因此,成立了IT部门并招聘了两名工程师。这时候,操作系统的安装就需要有标准了,否则相同版本的操作系统不同的人安装,由于安装模式不同,可能装的五花八门。这时候,补丁也需要关注了,采取的方式还是手工下载补丁包、手工打补丁。配置管理则是依据编写的文档手工修改。日志和告警需要手工检查,安全策略通过配置防火墙测试实现。这时候,随着内部IT业务系统规模和种类的增加,以前简单采购方式,已经无法满足大卫公司的业务要求了,因此大卫公司成立了IT研发部门。

级别3:关注标准的执行

大卫公司运行了1年半以后,业绩翻了几倍。服务器数量从50增加到100台。这时候,为了提高服务器的利用率,大卫公司又买了RHEV虚拟化软件,并且将虚拟化整合比设定为1:8左右。也就是说,总共的RHEL操作系统数量在800左右。

这时候,IT顿时感到工作量巨大。此时,操作系统安装就需要从手工安装转化为自动化安全。而补丁管理需要使用yum源。配置方面,则需要使用批量脚本进行批量执行。定期巡检也要搞起来了。安全漏洞则需要定期扫描。

在这个阶段,大卫公司制定的IT标准已经完善,大卫也要求IT运维部门严格执行。

级别4: 关注执行过程中产生记录,统一管理

又过了三年,大卫公司的业绩又翻了几倍。操作系统数量已经突破2000。这时候,开发和生产环境中操作系统的版本已经比较多了,需要做操作系统版本管理。而补丁管理,也需要集中管理。配置管理则需要在级别3的批量脚本执行上,使用git或SVN进行统一管理。告警和日志也需要做集中管理,把操作系统和应用日志做统一收集和分析。安全漏洞方面,也需要做集中管理,以提高效率,避免出错。

级别5.实现开发运维一体化

又过了两年,大卫公司由于业绩太好,决定IPO,并且成功上市。这时候,该公司操作系统数量已经超过5000,应用类型几十种。上市以后,由于竞争非常激烈,老板大卫要求研发部门提升产品的研发速度。新产品的发布速度需要从6个月缩短到1个月。这时候,在大卫的安排下,开发部门和运维部门大佬们坐在一起,研究如何将devops落地。通过不断的学习和探索,devops在该公司实施成功,系统版本使用容器技术进行分层管理。补丁管理、配置管理、日志告警、安全漏洞的管理均实现了自动化。Devops在大卫公司成功落地以后,大卫公司竞争力大幅提升。

红帽卫星对于OS成熟度模型的意义

在OS成熟度模型中,大多数客户处于级别二到级别三的转化中。而红帽卫星,是能帮助客户将OS运维成熟度模型提到到四级(以红帽卫星为主,结合开源工具ELK)。而从四级到最终第五级的Devops,则需要OpenShift解决方案以及Ansible等工具。

红帽卫星

本文前半部分讨论了,如何通过GartnerIT基础架构和运维成熟度模型中的技术维度,引出OS成熟度模型,并且介绍了每一个等级的具体情况。那么,对于一个客户而言,红帽如何帮助客户提升OS运维成熟度级别?

这时候,找红帽卫星啊!(Red Hat satellite)

红帽卫星这个听起来很拉风的名字,除了可以帮助客户提升OS运维成熟度。还是红帽SOE架构的落地工具。SOE全程是Standard OperatingEnvironment,意思是标准操作环境,也就是将生产运维实现标准化。至于标准化的意义和好处,读者应该都比较了解了。

IDC 2014年发布的白皮书The Business Value of Standardizing on Red Hat

Infrastructure Solutions,里面谈到,通过在数据中心实施红帽标准化方案,不仅可以大幅降低IT基础架构的复杂度,还会带来巨大的收益、大幅降低TCO。

  • Optimizing Linux serverinfrastructure costs — saving $3,566 per 100 users per year Enhancing IT staffproductivity — lowering the labor costs of supporting services by $3,318 per
  • 100 users per year whileimproving IT services quality
  • Driving end-user productivityby delivering more reliable operational performance — adding
  • $2,319 in value per 100 usersper year
  • Increasing businessproductivity — lowering operations costs and adding new revenue totaling
  • $2,345 per 100 users per year

Satellite到底是什么?

可能很多读者对VMware的产品解决方案比较熟悉,我们可以大致将它和VMware的方案进行对比,以方便理解。

红帽Satellite=vCenter中的license管理+UpdateManager + VMware Configuration Manager+ vROps中的安全加固手册。

那么在Linux运维管理方面,Satellite具体能做什么?

  • 自动部署

目前很多客户采用各种开源技术实现了操作系统的批量安装和自动化部署、但是先前的做法可重复利用化程度很低,每当有项目需要进行自动部署时都需要针对该项目重新进行配置,工作量大且效率低下而且没有很好的版本管理和回退机制,也缺乏一个很好的管理界面来进行管理,希望通过有效的管理工具来实现快速部署海量服务器的问题。

  • 软件更新

目前行里的服务器升级都是去红帽官方网站下载然后手工进行升级操作,实效性、可追溯性差,管理员只是被动接收来自安全部门和红帽的安全建议,希望通过一个集中展示平台,直观的看到行内所有linux服务器目前运行的软件版本和官方版本之间的差异、升级的类型并直接通过统一的展示界面远程直接对需要升级的服务器升级某一个软件的升级程序。

  • 安全更新

国家现在对开源软件的安全性要求很高,很多行业客户的安全部门以及公安部会定期对所有的Linux服务器进行安全扫描并发布安全整改意见,这些意见和厂商提供的安全更新建议往往有很大的出入,迫切的需要一个工具能提供红帽产品的安全更新以及修复建议并且能结合上述的软件更新功能为系统及时的修补安全漏洞

  • 合规性检查

很多IT规模比较大的客户有自己的操作系统基线,定义了一系列的标准,这些标准需要人工来实现以及更,参与Linux运维的人员也很多,每个人的能力、对操作系统的理解程度以及使用习惯的不同会造成Linux服务器的配置存在很大的差异,有无可能通过一个集中式管理工具结合行里的运行规范来实现自动化部署并且可以根据已有古规范找出个与规范之间的差异并消除

  • 从开发到测试到运维的软件生命周期管理

很多客户的开发测试运维的环境都不完全一样,这就有在开发测试环境中可用但到了生产环境会出现问题的风险,希望通过工具来统筹管理开发、测试和运维平台上的Linux环境的部署,应用软件的分发以及合规性一致性的检测。

  • 多用户、用户组管理以及访问控制

很多客户基于Linux的系统都是以项目(业务)的方式进行划分的,每个项目都会有相应的软件中心和数据中心的技术人员负责应用软件和操作系统的开发、部署、上线、维护等工作,为了完成这些工作需要给相应的用户赋予相应的权限以避免越权操作,希望解决在大规模Linux使用环境下用户管理和权限划分的问题。

  • 服务器组批量操作

传统的Linux运维管理需要登录到服务器上手工或者通过执行脚本的方式来进行,对于一个项目而言,通常几台甚至几十台服务器的配置和运行环境是完全一样的,希望能实现像操作一台服务器那样操作一组服务器,执行一次操作就可以对该组内所有服务器都生效,即对一组服务器可批量进行升级、部署、管理和维护的工作。

总结:

截止到目前,相信大家对OS成熟度模型的相关概念有了一些了解,在后续的文章里,笔者会根据读者的反馈,做更深一步的介绍。

原文发布于微信公众号 - 大魏分享(david-share)

原文发表时间:2016-06-26

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏编程一生

谈谈服务治理

1702
来自专栏互联网数据官iCDO

DOMO-冉冉升起的自助式商业智能工具

自助式商业智能(BI)工具Domo通过能够快速建立数据连接并开启分析的网页版BI工具解决了自助式BI的难题,目前售价是每个用户每年2,000美金。不像其他的工具...

3604
来自专栏大宽宽的碎碎念

系统的请求量突然增大数倍怎么办?面试中怎么回答真实世界的流量问题最后的话

59516
来自专栏Grace development

浅谈架构是为了什么 (下)

从现在开始,假设我们自己是一个创业的小团队。没资金没人脉,靠技术打天下。现在要开发一套电商系统。开始自己的表演。

1032
来自专栏华章科技

如何入门 Python 爬虫?

之前转载过两篇关于“爬虫”的文章,小编在后台收到不少相关的留言,希望能够继续深入,所以有了下面这篇文章。

1302
来自专栏云计算D1net

如何管理好企业的数据

灾难恢复没有银弹。一旦发生停机,企业高管们会条件反射地以最快地速度采取各种灾难恢复手段。 虽然大多数IT主管和数据管理专家承认没有万全的安全解决方案来保...

3394
来自专栏Android 开发者

[译] 怎样把取消订阅的用户吸引回来

4084
来自专栏企鹅号快讯

年前爆炸一波!小程序视频功能来了!

好久不见,昨天小指南才说了小程序很久没有大动作,这不昨晚的深夜更新又啪啪啪的打脸了。一口气来了四个能力更新,赶紧听小指南说说吧~ ? --升级实时音视频录制及播...

2667
来自专栏北京马哥教育

你应该丢弃Windows,选择Linux的五大理由

自Linux这款开源操作系统发布以来,它就处于上升通道,这些年来已得到了改进和完善,以至于如今一个典型的发行版现在都是高度完善、功能全面的程序包,包括用户需要的...

3978
来自专栏java一日一条

源代码的寿命

看看你现在日常工作中的代码。已经运行了多久了?代码有多老了?有六个月?一年?可能都有五年这么久了吧?十年?二十年呢?!这样的代码有多老了?不到10%?还是一半?...

1101

扫码关注云+社区

领取腾讯云代金券