前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >服务器阵列崩溃,开工第一天就被迫停工?求网管心里的阴影面积

服务器阵列崩溃,开工第一天就被迫停工?求网管心里的阴影面积

作者头像
IT狂人日志
发布2022-05-18 16:30:12
3450
发布2022-05-18 16:30:12
举报

前天的文章开头还提到,年后第一天上班很清静、很悠闲,与往常的经验相悖,其实那都是假象,只是有的客户还没上班而已,这不,今天就接到让人心惊肉跳的报修了。

戴尔服务器没有识别到硬盘,系统无法启动。

服务器故障有三怕:一怕没有备份,二怕没有容灾,三怕阵列崩溃或者硬盘损坏;这个客户的报修,至少前面两个肯定中招:1、备份出来的数据是2021年12月31日的;2、没有容灾,服务器挂了,产线都得停工——因为是第一天上班,车间还没领料,设备也无法从服务器读取数据。

这年头,总有胆子大的,明明吃过亏,还不觉醒,舍不得投入,整天害怕、担心的,反倒是我们做IT外包的,见到上图那样的画面,我只能祈祷硬盘没坏。

距离比较远,先电话遥控一下吧,说不定问题不大呢。

指导客户按F11进入BIOS设置,并且进入“Device Settings”

在 Device Settings 菜单中单击相应的 RAID 控制器,并且在 Dashboard View 菜单中选择 Main Menu,然后在“Main Menu”中单击“Virtual Disk Management”,根据客户电话反馈,该服务器有一个虚拟磁盘,级别为:raid5,状态:Failed。

糟糕,一股不安的情绪顿时涌上心头,深呼吸几次,指导用户接着操作:单击 “View Associated Physical Disks”,即查看物理磁盘的状态。

客户反馈:RAID5由三块1T SAS硬盘组成,但是状态全部为:Foreign。

嗯?这是什么鬼?一共就三块盘,三块全部被踢出RAID?我就不信它们全坏了。

询问客户,这台服务器是不是年前关机了,今天上班刚开机?

客户回答:是的,老板要求节电,所以机房过年期间是断电的,服务器正常关机的,上班了才开机就不能启动了,重启,或者关机重新再开,都不行。

看来不是什么大问题,也许只是莫名其妙地Foreign了,先尝试把它们都导回去吧。

指导客户返回到“Main Menu”,这次单击“Configuration Management”,然后再单击“Manage Foreign Configuration”

然后单击 “Preview Foreign Configuration”,紧接着再单击“ Import Foreign Configuration”,意思是导入外部配置。这里一定要注意,千万别手贱点成了“Clear Foreign Configuration”,到时候哭都没地方哭,怕是辞职报告都来不及写,要赶紧跑路了,哈哈,开个玩笑啦。

接着操作:勾选“Confirm”点击“Yes”,确认导入外部配置。

客户反锁,系统显示消息“The operation has been performed successfully”,此时单击 OK,再按“Back”,再次返回到“Main Menu”,再次进入“Virtual Disk Management”,正常来说,此时虚拟磁盘的状态应该显示为“Ready”,那么重启服务器,基本上就没问题了,可是客户反馈,状态变成了“Degraded”。

阵列被降级了,也就是说,有一块硬盘没上线,正准备指导客户再进行其他操作时,听到电话中传来其他人催促的声音,语气很不好的样子。

于是跟客户说:“算了算了,先重启一下试试看吧。”

电话那头传来服务器的呼啸声,片刻,传来网管兴奋的声音:“服务器正常启动,已经进入桌面。”

“麻烦你再看一眼服务器,有没有硬盘闪黄灯?”

“哎,还真有,刚才还都是绿灯的,现在是0号磁盘闪黄灯了。”

“现在先不弄了,中午休息的时候再折腾吧,你现在马上备份服务器数据。”总算松了口气。

等到中午,致电客户,指导他在服务器启动的时候,按下CTRL+R,进入阵列卡配置界面,找到“offline”的0号磁盘,按F2,然后选择“Force Online”——强制上线,片刻后,显示上线成功,Virtual Disk的状态又从“Degraded”变成了“Ready”,至此,问题完美解决。

有些问题就是这样了,听上去很吓人,其实也就那么回事,但是作为企业的IT人员,也不能大意,还是得注意备份,还是那句话:再好的技术,也比不上勤快的备份来得靠谱。

——笔者为网络工程师,擅长计算机网络领域,创业多年,希望把自己的经验分享给大家,如有相同或者不同观点,欢迎评论。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-02-09,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 IT狂人日志58446291 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
对象存储
对象存储(Cloud Object Storage,COS)是由腾讯云推出的无目录层次结构、无数据格式限制,可容纳海量数据且支持 HTTP/HTTPS 协议访问的分布式存储服务。腾讯云 COS 的存储桶空间无容量上限,无需分区管理,适用于 CDN 数据分发、数据万象处理或大数据计算与分析的数据湖等多种场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档