五一将至,服务器也要放假?

机房作为设备集中存放的地方,要面对各种各样的问题,处理各种各样的事情,如服务器上架下架,处理问题服务器等等。那么,在机房设备的维护过程中要注意哪些问题呢?

数据中心的设备维护需要注意哪些要点

1.消防设备维护

消防设备的维护是机房最为基本的维护,当消防设备出问题,对于机房的影响是非常巨大的,一般消防设备维护主要是检查火警探测器、手动报警按钮、火灾警报装置等;

2.机房漏水设备维护

定时查看漏水传感器跟感应绳有没有损坏或失灵,避免灾害发生时不能及时检测到;

3.UPS及电池维护

机房都会有电池以及ups相关的设备,那需要对机房不间断电源的数据进行采集以及检查维护,确保确保电池组正常工作,同时同时要根据实际情况进行电池核对性容量测试;进行电池组充放电维护及调整充电电流,确保电池组正常工作;检查记录输出波形、谐波含量、零地电压;查清各参数是否配置正确;定期进行UPS功能测试,如UPS同市电的切换试验;

4.机房空调及新风维护

机房空调主要是调节机房的温湿度,一般机房内的温湿度都需要保障常温下,所以需要检查空调运行是否正常,要检查机房换风设备运转是否正常;

5.照明电路维护

照明电路设备维护主要包括镇流器、灯管及时更换,开关更换;线头氧化处理,标签巡查更换;供电线路绝缘检查,防止意外短路;

6.设备除尘维护

设备除尘维护主要是定期对设备进行除尘处理,清理,调整安保摄像头清晰度,防止造成机房监控设备将尘土吸入监控设备内部的情况发生;

7.机房安防保障维护

检测视频门禁等设备确保设备的长远运行,避免设备故障,防止不相干人等随意进出;

8.其他维护

机房其他维护包括基础维护,如:防鼠、地面除尘、防雷器检查、静电地板清洗清洁、缝隙调整、损坏更换、接地电阻测试、主接地点除锈、接头紧固、接地线触点防氧化加固等维护同时要管理好机房那需要完善机房运维规范,同时需要优化好机房运维管理体系。

数据中心运维制度

出入管理

1、进出机房人员应严格遵守《机房人员进出制度》。

2、进出机房设备应严格遵守《机房设备进出制度》。

机房设备管理

1、机房的市电输入、配电柜、照明系统、UPS电源、柴油发电机等动力系统的日常运维由数据中心专门人员负责,特殊情况可请上级单位配合完成。

2、机房空调及新风系统由数据中心专门人员负责运维。

3、机房消防系统由数据中心专门人员负责运维管理。

4、门禁系统、保安监控系统由数据中心专门人员进行日常运维工作。

5、机房内的路由器、交换机、服务器等设备,如果属于合作协议约定范围内的设备,则按照协议规定的责任方承担运维责任,其它设备由数据中心统一运维。

6、以上设备的由原厂商或其代理商提供售后维保工作,数据中心负责售后维保协议的有效性。

7、设备的命名、线缆标签的制作等均应符合相关规定,并与现场设备保持一致。

值班管理

1、值班人员应具有认真、负责的工作态度和科学、细致的工作作风,按时上、下班,坚守岗位。

2、遵守各项规章制度,按照值班工作流程(巡检表),监视各系统运行状况,出现异常情况,按规定立即上报。3、值班人员必须认真、如实、详细填写《机房日志》等各种登记薄,以备后查。

运维管理

1、日常运维工作按照《数据中心运维服务管理方案》进行。

2、编制月/季/年度运维管理的作业计划并执行。

3、运维人员进行日常维护操作必须按照《设备使用手册》和《操作指南》进行,非日常操作内容需报主管人员批准后进行。

4、所有的操作实行双人作业制度,并形成详细的操作记录。

5、系统运行过程中出现的故障事件,按照《故障处理流程》进行处理。

6、运维主管人员应定期和不定期对相关制度的执行情况进行检查,并作为运维人员的考核依据。

7、对基础维护数据报表进行深入分析与多向比对,从核心技术层面对维护工作进行优化,提高维护工作的效率,严格把控维护工作质量。

应急管理

1、机房设备和系统的应急预案,保证应急事件发生时有序、高效执行。

2、建立应急事件演练制度,保证应急预案处于可用状态。

3、建立应急物品专门储备、专人管理,应急外围资源随时更新,以及紧急启用的审批流程。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190429A0C36B00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券