首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

监控系统在机房维护中有何应用?机房三大监控系统介绍

数据中心机房监控系统主要是对机房内设备和环境进行集中监控和管理,通过采集机房运行中的各种数据参数,来判断是否出现异常,对数据中心机房具有重要意义。机房监控系统包含多个方面,而不只是简单的视频监控,理论上,机房任何区域都有出现问题的可能,监控系统的覆盖性一定程度上决定机房运行的稳定性。下面就来详细介绍一下数据中心机房的三大监控系统,以及它们各自具有的功能。

(一)数据中心机房之“设备监控系统”

数据中心机房里的设备成千上万,对这些设备的运行情况进行监控非常必要,比如服务器运行的CPU内存参数,网络设备的端口流量,业务层面的监控等等,设备层面的监控就更为复杂了,需要对设备的各种运行参数比较清楚,因此一般设备的监控系统都采用设备厂家提供的监控软件或者标准的第三方软件来进行管理。

(1)通过这些监控软件,7*24小时对设备运行的各种参数进行监控,一旦发现有异常就发出告警。

(2)告警的方式也比较多,可以打印到日志主机上,可以通过短信发送到运维人员的手机上,也可以通过软件系统自行尝试修复。

(3)监控的软件做的是否完善将决定故障出现时,能否给出告警,所以涉及设备的监控往往是在不断完善的过程,很多监控参数都是经验之道,甚至是历史的教训,只有通过不断地改进、优化,才能将发生的风险及时发现,当然要做到所有的故障都可能提前预知、发现,是非常困难的。

(4)有时的故障可能无任何征兆,尤其是硬件故障,会突然出现,而往往监控系统是无法监测到硬件级别的、元器件的故障。

(二)数据中心机房之“视频监控系统”

和其它的商务建筑一样,数据中心机房也需要部署视频监控系统。视频监控主要是对进出数据中心机房的人员进行监控,在数据中心机房的出入口要部署摄像头,在数据中心机房内部楼道,重要的机房入口都要部署。

在有的非常重要业务的机房内,有时也要部署摄像头,以便防止一些人员的恶意操作或者误操作,发现这些异常时及时制止,以防止给数据中心机房业务带来影响。数据中心机房里的很多设备、仪器都是非常昂贵的,因为人为的原因导致损坏的情况是非常多见的,还有就是防止一些偷盗行为。比如数据中心机房里的光模块,一个光模块,尤其是40G/100G光模块,一个都要数千元,顺手拿出去几个,转手可以获利上万元。

有了视频监控系统,就能最大限度地避免这些行为出现,或者在出现后可以通过这些监控录像进行分析、追责,这些视频录像是重要的证据,所以视频监控系统是数据中心机房不可缺少的一部分,有的数据中心机房除了视频的监控,还要在数据中心机房出入做好人员访问登记工作,对外来人员进行管理,避免放入一些恶意分子。

(三)数据中心机房之“烟雾温湿监控系统”

数据中心机房一样怕火,一旦发生火灾对于数据中心机房来说就是毁灭性的打击。以往也出现过一些惨痛的教训,所以对于放火,数据中心机房且不可大意。数据中心机房和其它的建筑不同,内部有太多的电子设备,并不适用于喷淋系统,只能采用干粉灭火或者惰性气体灭火。

当机房内的烟雾浓度超过了报警器设定的门限,即触发监控系统,及时将火灭除,除了烟雾,机房内的温度和湿度也是需要监控的重要部署。数据中心机房内部要尽量保持恒温恒湿,但实际上在数据中心机房内部会有局部的温度死角,长期以往会大大降低电子设备的使用寿命,通过在数据中心机房内多个区域部署温湿度传感器,建立起温湿度的监控网络,就可以及时地发现局部区域过温过湿的情况,在一些空气污染较为严重的地方,还可以部署空气清洁度监测的设备,数据中心机房设备运行在污染严重的环境里,容易造成静电、电容击穿器件等故障,为何我们要求数据中心机房设备要周期性地进行除尘就是这个道理,本身灰尘中就含有不少的污染物。

数据中心机房在高速的发展,各种新技术层出不穷,也让数据中心机房运行变得愈加复杂,这给监控系统也带来了不小的挑战,如何通过监控系统及时发现运行风险,是监控系统关心的永恒话题。

尽管数据中心机房有各种各样的监控系统,但是可以确定的是监控系统无法提前发现所有的故障,尤其是设备级别的故障,但是通过完善的监控系统的确可以大大避免很多故障。就算监控系统没有在发生故障时,给出告警,但是在事后故障分析中,监控系统的各种技术参数和记录依然是可供分析的重要资料,通过对这些监控记录很可能可以找出故障的原因。监控系统的作用就是将历史经验、教训转化为一些数据参数,然后采集数据中心机房里的各种数据信息进行对比,如果发现异常,就及时给出告警。数据越丰富,监控系统的功能就越强大。

总结:

不要以为一个数据中心机房不是部署了监控系统就可以高枕无忧了,任何的系统都有漏洞,何况是监控系统,所以数据中心机房运维人员还要在日常的工作中,多检查,多分析,及时发现隐患,如果监控系统未能发现,那么想办法将这些隐患的判断加到监控系统中,使监控系统越来越完善,决不能允许相同的错误,连续犯两次。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181107B1P7XG00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券