首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

机房管理的日常点滴

这一节与大家共同学习的是信息科机房管理每天都要面对的设备管理、环境管理、安全管理、门禁管理、废弃物管理、电源管理等琐碎的小事。对于这些琐事,其实是保证我们整个系统稳定运行的重要环节。通过这些点滴的安全做到了,才有整个系统的安全运行。安全无小事,小事保安全。从个人多年的经验来说,再好的设备也不能替代一个负责任的工作人员。

先声明下,ITIL并没有机房管理这一章节。这是几部分内容的整合,而且还添加了国内相关标准中对机房管理的要求。严格意义来说,这不算正儿八经的ITIL知识,但医院信息管理中机房管理的重要性不言而喻,它承载了服务器、存储、核心交换机等信息化的关键设备的安全,重要且头绪多,有必要梳理出来一起学习下。

从思维导图可用看到机房管理主要涉及环境、电力、门禁、设备、人员及维护等相关因素,接下来我会一一道来。

环境设置

位置选择:指的是机房所处位置的内外部环境。国标规定,机房不能设置在建筑物的顶楼或者地下室;机房楼上也不应有供水管;不应在车库等封闭环境中;机房附近施工应与机房管理者告知......。某医院在新楼建设中,将机房安排在了大楼负一楼车库,虽然信息科多次抗争,最终依然将机房确定在了负一楼车库。带来的问题就是夏天车库闷热会导致空调外机保护性关闭,又花更多的代价将外机迁移到了更远的地面。车库里空气污浊,造成机房的精密空调滤网频繁更换。在机房运转的这些年里,遇到的诸多故障都不断提示着“国标”的重要。在选择机房位置时,还应该考虑楼板的承载力,机房里一些较重的设备是否超重需要提前规划,并做必要的技术改造,以确保楼宇安全。

标志管理:ITIL规定,在标志设置上,既要确保可以找到机房,但又不能明显的设置,使其成为被攻击的部位。比如有些地方在机房门外明确标记“机房重地,非请莫入”,而且机房就设置在病区中的一个角落,木门玻璃窗。很容易受到伤害,真不知道是否发生过破窗而入的情况。在机房里也应该做好标记,当机房因故障停电时,工作人员能够准确找到出口。

环境控制:是为了确保机房内的物理条件能够达到设备运营所需的最恰当水平。这些条件包括:温度、湿度、空气质量、以及外部环境风险,例如火灾、洪水等的影响。

温度、湿度主要通过供暖和冷却系统,以及机房内设备的布局来调节。这需要确定设备的的散热量及其最佳的工作温度。一般来说机房内温度应在20-25度,湿度保持在20-70度的范围内。我们在安装设备时还应仔细阅读安装说明,确保符合设备运行条件。环境温度过低有可能会在设备表面形成冷凝水,而湿度过低会增加产生静电的可能,严重时造成设备损坏。还应该注意不同季节大环境湿度对机房的影响,及时观察机房内的温度和湿度,才能及早发现问题,消除隐患。水质对精密空调的影响也不容忽视,曾经遇到一起因当地水质过硬,导致水冷式精密空调内钙质大量堆积引起设备宕机。

烟感探测器通常作为一种防火措施来安装,并连接到自动消防系统。但是,我们还需要将烟感探测设备连接到监控室。以便出现任何异常情况都能及时进行调查。

活动探测设备安装在所有无人值守的工作区域。它们能监测到未授权的访问,并报告给安保部门或者监控室。

灰尘和颗粒探测器可以让管理者了解机房空气质量。监视器也应该连接到监控室,这样就可以在发生重大损坏前,调查和纠正偏差。

在地震活动带上可以安装建筑物移动探测器,作为预警系统它可以在重大地震对被感设施发生影响前显示,使得系统及时关闭或切换到备用的地点。类似的监视器和安全装置也可以安装在暴风雨活动频繁的地区,加强对机房的监控。

废弃物管理,包括回收物品的分类及处理、有害物品(例如电池。空调制冷剂等液体和气体)的处理等,总之一句话,机房内应保持整洁,需及时清理废弃物。一些医院在设计机房时,忽略了工具间的设置,就导致了在机房运转时,大量的工具、备件堆放到了机房。对机房能耗和安全都会造成负面影响。甚至有些单位将UPS房间混同于杂物间使用,更是增加了火灾发生的风险。

设备安装:包括网络布线、电力供应、活动地板、吊顶、门禁系统、办公家具等。这些设备是辅助机房内关键设备的配套物品,但也需要依照标准,因地制宜做好设计和布局。设备的重量不同,必须平均分配,以免地板的压力过大;不同种类的设备对供电的要求可能不同,如果简单地按收货的顺序把设备放在数据中心里,可能给维护带来麻烦,工作人员必须往返多次才能完成工作。这种往返危及了机房内其它设备的完整性和安全性。这意味着好的规划和设计数据中心布局,能够保证机房内设备的最佳使用和安全。

电力支持

电源管理指管理用于保证机房内设施运行的电力供应。

首先我们应制定好电源使用规划,办公区用电和核心设备用电最好分开。电源插头应不容易被拔出,避免出现做机房卫生时碰掉电源的情况;机房必须是提供双电路的,以确保当一路线路出现问题或者维修时,另外一路能够提供电力供应;评价用电计划,避免出现电力供应缺口;做好应急供电计划并保证切实可行,比如备用电源采用的柴油发电机,应确保发电机可用。

UPS管理,按照国标要求,每半年必须对UPS做放电测试。UPS电池是发生火灾的主要原因,因此应该加以防范。尤其是对服役时间超长的UPS电池应该主动淘汰,消除消防隐患。应重视UPS的告警日志,及时处理,消除隐患。

门禁管理

正因为机房重地,必须对人员进行严格管控,从而减少不必要的错误发生。而门禁就是其中必不可少的手段。

首先,我们应该根据重要程度和保密等级,将机房划分不同区域,确保不会错接造成内外网连通或者保密设备联入互联网的情况发生。

其次,所有的出入口都需要安装访问控制设备。这些设备的目的是确保只有经过授权的人员才能够进入受限的区域。

第三,机房安装视频监控设备,记录下所有进入机房人员情况,监控设备应连接到医院的监控室统一进行管理。

第四,机房内的重要设备不应提供远程登录操作,或者在提供远程登录操作时有安全控制设备(如堡垒机)。

第五,加强设备密码管理,初始密码和默认密码必须修改。避免使用常用电话号码等容易破解的密码。

第六,机房管理者应对所有机房的设备和操作负责,有权询问任何操作人员。

维护管理

有计划的运维能够极大的减少设备故障。机房内的设备应该定期有计划的进行维护。维护内容包括易损件的更换,故障部件的及时更换,减少非计划宕机事件的发生。有的人说,反正医院也不重视我们机房建设,连个标准的机房都没有,任由设备自我运转;有的人说,我们是标准机房,设备放里面很安全,不用做维护;甚至还有人说,我们实施了虚拟化,出现故障会自动漂移的,不会对业务造成影响。任何放任行为,都会带来大的故障。曾经有医院系统宕机,所有数据丢失,直接原因是存储设备中五块硬盘损坏。但更进一步追查,一台存储五块硬盘同时坏的几率还是非常小,该医院机房采用B级标准建设,硬件设施一流,维护人员却疏于管理,是造成设备最终故障的主要原因。

日志管理包括管理日志、设备日志、系统日志等,日志记录是对某项重大操作的记录,是设备运行状态的反映。尤其是一些告警日志,必须及时查明原因,加以处理。另外日志存放是会消耗存储空间的,也应该制订适宜的策略加以约束,避免出现因日志扩展造成的存储空间不足的情况发生。一天早上,医生反映工作站不能使用,通过及时查看管理日志发现,头一天有工程师去做过系统升级,后查询升级脚本发现是升级后的设置BUG造成,问题被及时解决了。

应急管理是信息系统最后一根救命稻草,是出现故障后,确保系统及时恢复的手段,必须有针对的制订切实的方案。方案要有演练,确保方案的可落地实施。如当空调故障时,机房如何降温;当设备故障时,替代方案是什么;当数据库宕机时,备份数据何时启用等等。

设备管理

保证机房内的设备正常的良好的运转应该树立设备生命周期的概念。从设备的论证开始,就应该结合机房的实际情况进行。从机房电力供应、空调保障、楼宇荷载、场地需求、软件性能要求、维护人员技术要求去整体考虑设备选型;在设备安装时应考虑散热要求,功能分区要求。设备上应设置明显的标牌,内容包括:编码,用途,责任人,设备启用日期,支持工程师电话号码等。

有些医院的机房还承担着区域信息化设备的运维任务。应该做好标记,避免误插误拔。

人员管理

机房作为核心区域,进入其中的人员应严格控制。尤其是要加强对几类人员的防范。

1.保洁人员保洁人员在医院很多区域出现都不太会引起大家关注,但是往往一些善意的举动就造成了灾难的发生。曾经保洁人员在清洁时发现,地上多了个线头,于是他很学着工作人员的样子,将线头插进了交换机的空闲口,于是回路形成,网络大面积拥堵,造成无法使用,而且这种故障排查需要技巧和时间。

2.外来运维人员外部技术人员是我们医院信息服务的有效的技术保障,他们辛勤的劳动保障了我们系统稳定高效运行。因此一般医院都会有一些开发人员、驻场工程师、数据库运维人员等等。但是同样应该加强对他们的管理,避免有意无意的错误操作造成系统故障或者数据外泄的情况出现。比如,定期组织他们开会,宣讲科室政策;与第三方服务商约定,上门服务必须提供工作证;在签署合同时,约定因公司不及时告知的人员变动带来的安全问题,由公司承担相应损失。进而提高驻场工程师的依从性。

3.安保人员一般情况下,信息科没有配备专门安保,都是由值班人员负责科室的安全工作。值班人员应保持与医院安保人员的密切联系,确保出现问题能够及时得到支援。

零零碎碎说了很多,也许还有没考虑到的地方,欢迎大家留言,一起来讨论。最后还是送上我们呼吸科何勇主任的美图,愿大家都有好心情。

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180129G0GIUK00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券