华为DCIM+帮助数据中心实现智能化运维

日常巡检是数据中心运维工作中重要一环,可以尽早发现机房存在的各种隐患。为此,我详细制订了机房巡检制度,精心设计了机房巡检Checklist,并且部署了电子巡更系统。目前从巡检记录来看,运维班组每天均按时按量完成了巡检工作,但我并没有因此而放心。因为,我观察到他们只是机械性的完成各种抄表动作,然后上报一切正常;有一次,我在抽查巡检记录时就发现某一台空调回风温度明显高于周边空调,存在问题,但事前却无人发现。

01

数据中心运维面临严重的人才紧缺

随着近几年云计算的快速兴起,数据中心日益集中化&大型化,数万机架的超大型数据中心正在陆续出现,导致数据中心的运维管理日益复杂化。根据2017年CDCC数据中心行业趋势调研结果显示,高达93.7%的受访者表示数据中心运维人才匮乏,高端人才与低端人才均紧缺;而受限于薪资、职业前景等多种因素,人员离职率高,经验难以传承。

另一方面,根据Ponemon研究所的调查报告,2016年数据中心中断事故中,高达22%来自于人为错误;数据中心运维是一门技术活,不合适的人员会给数据中心速来更多的安全隐患。总之,无法获取足够、合格、有责任心的运维人员来支撑数据中心运维工作,成为了当前的一大难题。

02

有限的人才应聚焦于创造性的关键任务上

人的最大特点在于主观能动性,用对人、用好人是管理学的精华所在。如果换一个角度来看上面所提到的日常巡检问题,一名运维人员在日复一日、重复枯燥的数百次或上次抄表工作中,不懈怠、保持警觉性,从中发出某一个隐患,可能并不是人人均可胜任的。如果能够让不胜任的运维人员也能胜任当前工作,则人才匮乏的问题自然就解决了。或者更进一步,借助合适的辅助工具,让有限的人力摆脱重复性、机械性的工作,更加主动管理好数据中心,更好的发挥人的主观能动性。

03

智能化管理,帮助运维人员更高效的工作

智能革命正在到来,将逐步重构现有的数据中心运维方式。如同智能工业机器人的出现,正在将一些劳动密集性产业重新改造成技术、资本密集性产业,解放人员的生产力,重构整个产业的竞争格局。而在数据中心运维中引入智能化技术,借助智能化管理系统来帮助运维人员分析问题、发现问题、解决问题,大幅降低对人员技能素质的要求,减少人工参与环节,从而保障数据中心的长期、可靠运行。

例如:在日常巡检中,由智能化管理系统来自动完成各类抄表工作,自动分析与对比数据来发现问题,给出处理建议并通知用户;这样,将大幅减少日常巡检中的重复枯燥的工作,让人员聚焦于有创造力、更擅长的工作上。

华为基于自己20+年的数据中心运维经验,结合智能化技术推出了DCIM+解决方案,实现了智能硬件与智能软件的协同工作,主动识别机房潜在隐患,主动预防性处理,从而帮助数据中心实现运维自动化,大幅提高人均运维效率,保障数据中心的高可用性。

  • 发表于:
  • 原文链接:http://kuaibao.qq.com/s/20180103B0NFHV00?refer=cp_1026

同媒体快讯

相关快讯

扫码关注云+社区