首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

为什么说云计算运维复杂,运维管理应提供什么功能?

大数据观察

了解大数据,关注大数据观察吧!

每个想了解最新大数据资讯的人,都关注了我

文 / 数据君

到今天,云计算的工业实现已经不太难了。现在有开源软件KVM和Xen,这两个东西基本把虚拟化搞定;而OpenStack则把管理、控制系统搞定,也很成熟。

PaaS也有相应的开源,比如OpenShift,而Java里也有N多的中间件框架和技术。另外分布式文件系统GFS/TFS,分布式计算系统Hadoop/Hbase等等,分布式的东西都不神秘了。技术的实现在以前可能是问题,现在不是了。

对于云计算工程方面,现在最难的是运维。管100台、1万台还是100万台机器,那是完全不同的。机器少你可以用人管理,机器多是不可能靠人的。

运维系统不属于功能性的东西,用户看不见,所以这是被大家严重低估的东西。只要你做大了,就必然要在运维系统上做文章。数据中心/云计算拼的就是运维能力。

为什么说运维比较复杂,原因有这么几个。

一方面,云计算要用廉价设备取代那些昂贵的解决方案。互联网就是要用便宜的东西搭建出高质量的东西,硬件和资源一定不会走高端路线——比如EMC、IBM小型机、SGI超级计算机等等,你如果用它去搭建云计算,成本太贵。用廉价的解决方案代替昂贵的解决方案是整个计算机发展史中到今天唯一不变的事情。

所以如果你要让夏利车跑出奔驰车的感觉,你需要自己动手做很多事,搭建一个智能的系统。用廉价的东西做出高质量的东西,运维好廉价的设备其实是云计算工程里最大的挑战。

另一方面,因为机器多了,加上用的又不是昂贵的硬件,所以故障就变成了常态,硬盘、主板、网络天天坏。所以,没什么好想的,运维就必须要跟上。云计算的目标是在故障成为常态的情况下保证高可用——也就是我们所说服务的可用性,是3个9、4个9还是5个9。

最后,这一大堆机器和设备都放在一起,安全问题就是一个挑战,一方面是Security,另一方面是Safety,保证数十台数百台的设备的安全还好说,但是对于数万数十万台的设计,就没有那么简单了。

云计算商业模式就是要实现IT即服务,无论是对外还是在企业内部,IT自服务的需求越来越明显。另一方面,超大规模的数据中心急需一个有效的挂历方式来降低运营成本。

在云计算技术体系架构中,运维管理提供IaaS层、PaaS层、SaaS层资源的全生命周期的运维管理,实现物理资源、虚拟资源的统一管理,提供资 源管理、统计、监控调度、服务掌控等端到端的综合管理能力。云运维管理与当前传统IT运维管理的不同表现为:集中化和资源池化。

云运维管理需要尽量实现自动化和流程化,避免在管理和运维中因为人工操作带来的不确定性问题。同时,云运维管理需要针对不同的用户提供个性化的试图,帮助管理和维护人员查看,定位和解决问题。

云运维管理和运维人员面向的是所有的云资源,要完成对不同资源的分配、调度和监控。同时,应能够向用户展示虚拟资源和物理资源的关系和拓扑结构。云运维管理的目标是适应上述的变化,改进运维的方式和流程来实现云资源的运行维护管理。

云计算运维管理应提供如下功能:

第一,自服务门户。自服务门户将支撑基础设施资源、平台资源和应用资源以服务的方式交互给用户使用,提供基础设施资源、平台资源和应用资源服务的检索、资源使用情况统计等自服务功能,需要根据不同的用户提供不同的展示功能,并有效隔离多用户的数据。

第二,身份与访问管理。身份与访问管理提供身份的访问管理,只有授权的用户才能访问相应的功能和数据,对资源服务提出使用申请。

第三,服务目录管理。建立基础设施资源、平台资源和应用资源的逻辑视图,形成云计算及服务目录,供服务消费者与管理者查询。服务目录应定义服务的类型、基本信息、能力数据、配额和权限,提供服务信息的注册、配置、发布、注销、变更、查询等管理功能。

第四,服务规则管理。服务规则管理定义了资源的调度、运行顺序逻辑。

第五,资源调度管理。资源调度管理通过查询服务目录,判断当前资源状态,并且执行自动的工作流来分配及部署资源,按照既定的适用规则,实现实时响应服务请求,根据用户需求实现资源的自动化生成、分配、回收和迁移,用以支持用户对资源的弹性需求。

第六,资源监控管理。资源监控管理实时监控、捕获资源的部署状态、使用和运行指标、各类告警信息。

第七,服务合规审计。服务合规审计对资源服务的合规性进行规范和控制,结合权限、配额对服务的资源使用情况进行运行审计。

第八,服务运营监控。服务运营监控将各类监控数据汇总至服务监控及运营引擎进行处理,通过在服务策略及工作请求间进行权衡进而生成变更请求,部分标准变更需求别转送到资源供应管理进行进一步的处理。

第九,服务计量管理。服务计量管理按照资源的实际使用情况进行服务质量审核,并规定服务计量信息,以便于在服务使用者和服务提供者之间进行核算。

第十,服务质量管理。服务质量管理遵循SLA要求,按照资源的实际使用情况而进行服务质量审核与管理,如果服务质量没有达到预先约定的SLA要求,自动化地进行动态资源调配,或者给出资源调配建议由管理者进行资料的调派,以满足SLA的要求。

主题 |云计算

插图 | 网络来源

作 者 介 绍

数据君:)

了解大数据,关注大数据观察

部分图文来自网络,侵权则删

我想给你一个理由 继续面对这操蛋的生活

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190121B0W53400?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券