首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

RAID5故障引起共享盘丢失?看我如何快速恢复

接到客户微信报修,说是共享盘断开,也就是网络驱动器丢失了,显示为红色的叉,无法连接。

我们的技术人员通过堡垒机,也无法登录该服务器。

那就只能驱动前往了,到了客户机房,只看见服务器是在蓝屏状态。

重启后,又出现“你的电脑出现问题,需要重启……”,此时发现,0号磁盘为黄灯,顿时有种不祥的预感。

耐心等它跑完,重启服务器,没有看到CTRL+R进入阵列卡管理界面的提示,所以就按F2进入设置界面,然后再找到阵列卡配置,查看硬盘状态。

很明显,0号磁盘确实坏了,好在是RAID5,应该不至于丢失数据。

退出设置,尝试启动操作系统。  

不出所料,系统还是可以进入的,看了一下文件资料,应该没有丢失,通知客户,共享盘暂时已恢复,同时申请一块硬盘。

3T的硬盘不好找了,直接上块4T的SAS 7.2K。注意,此时服务器不要关机,直接拔掉旧硬盘,插入新的硬盘就可以了,RAID5会自动重建的。  

新硬盘插入后,状态显示正常,根据经常,RAID5正在重建中。

由于这台旧服务器前期没有配置iDRAC,此时又不方便再重启,所以直接在系统里安装DELL OpenManage System Management Software,也一样能看到RAID5同步状态,当时并没有截图,以下是为了写文章,后补的图片。

从时间上日志可以看到,12:37拔出坏硬盘,12:51新硬盘接入,RAID开始重建,到晚上19:56,RAID5重建完成。

顺便说一句,在Windows Server中可以通过DELL OpenManage System Management Software来配置iDRAC,修改IP地址,修改密码等。

然后就能通过浏览器,访问iDRAC,实时查看服务器状态,以及配置邮件告警等功能。

下图1是服务器物理磁盘的状态,目前状态良好;下图2是服务器虚拟磁盘的状态,可以看到两组RAID5磁盘当前都是正常的了。

至于,邮件告警功能,配置也不难,看图片便知。

第一步,配置发件服务器及相关信息;

第二步,配置收件人,注意,当然可以是多个收件人;

第三步,设置报警的内容;  

下次服务器再有什么故障,你就能收到邮件了,能在很大程度上防患于未然,尤其是硬盘故障,早点知道,能避免数据丢失的损失。

当然了,能部署Zabbix或者Prometheus这类实时监测软件,那就更好了,凡是我们长期服务的客户,基本上都在我们的监测之中,我们平时远程,也基本上是通过堡垒机完成,毕竟,安全第一嘛。  

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OZ6BYQJptjTZ89hsGfH78lfg0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券