首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

硬盘故障修复 原

近期公司一台服务器的磁盘告警“磁盘阵列错误”,经检查发现磁盘:“PD0/PD1/PD2 硬盘Medium Error DevId 并BadStripe PD0 PD1”,需要在服务器磁盘彻底崩溃之前进行...raid修复,具体过程如下: 故障排查 根据告警信息进行定位: ?...故障定位:请求支援 到底如何定位问题所在呢???答案只有一个:日志! 日志太多了,看哪些?...故障定位:信息采集 Dell技术支持会提供日志采集工具,在此推荐使用MegaCLI8_Linux.zip (为方便使用,已上传至本地镜像库,内置使用说明),点击该链接可直接下载使用,如果在家办公,该地址不能用...故障定位:剧终! Dell技术支持经过日志排查问题后会反馈结果以及处理建议,后续需要运维和ucloud机房以及Dell工程师协调时间,更换磁盘,更换磁盘前一定要记得备份数据以及做好服务迁移啊!!!

1.6K20

硬盘IO性能估算入门

一、硬盘IO的类型 IO是输入输出指令,操作系统向存储控制器下发一个读或者写数据的操作指令,控制器下发地址和数据给存储设备,并返回结果给存储控制器,最后到达操作系统。...普通磁盘一次只能响应一个IO指令,但RAID等存储设备的IO操作是并发的。对顺序IO的设备,调整IO队列深度,性能不能产生变化。 二、硬盘性能衡量 衡量硬盘性能,最直观的就是IOPS和吞吐量。...三、硬盘监控指标 通过iostat等工具观察存储设备状况,我们一般关注下面指标。 1、r/s、w/s,每秒读写IO次数。 IOPS = r/s + w/s。...5、 svctm,IO服务时间 处理IO请求的耗时,比如机械硬盘耗时,由寻道时间、旋转延迟和传输时间组成。...SSD硬盘IO计算 固态硬盘没有寻道时间和旋转时间。

11.9K152
您找到你想要的搜索结果了吗?
是的
没有找到

从机械硬盘和固态硬盘的结构来看IO

我们取个折中,假设随机IO的耗时是10ms,那么1s可以做100次随机IO,看到100这个数字,你是不是明白了什么~,这个是真的小,这也是为什么我们对于QPS较高的接口,都要加个缓存层,因为磁盘扛不住啊...当然以上都是随机IO,顺序IO就大大不一样了,顺序IO的速度堪比内存的离散读写,总之很快,像大名鼎鼎的kafka就是磁盘顺序IO,所以至少在磁盘读写这块它的性能还不错。...顺序IO之所以快,首先盘片不需要每次转动了,其次我们的磁臂也不需要大幅度的摆动去寻道了,因此节省了大量的物理耗时,速度和随机IO之间应该是数量级的差异。...,通过上面的计算,我们可以大概得出对于一个7200转的机械硬盘来说,它的iops大概在100左右,每次io的耗时在10ms左右 kafka也是写磁盘的,它却挺快的,为什么?...因为kafka是顺序io,就算对于机械硬盘来说,顺序io也是很快的,因为它不会像离散io那样,需要过多的寻道。 SSD为什么比普通的机械硬盘要快?

1.7K20

服务器硬盘故障预测实践

我们的服务器使用年限超过5年后,硬盘故障率都是非常高。 ? 于是乎,想快速有效的降低服务器故障的影响,核心就在于降低硬盘故障的影响。...我们对三种值进行了分析:每秒磁盘读写块数和每秒之中用于IO操作的CPU时间占的比例,通过对比多种方法,最终我们选用临近两个时间点之间的IO变化的绝对值作为主要的元数据,也就是后一个时间点与前一个时间点对应...IO差的绝对值,简称为IO跳变。...它与磁盘故障间关系如图3所示: ? 由上图可以看到故障时的IO跳变大小排在前10%的故障数占比66%以上,看到这个本来让我们有信心可以用它来预测磁盘故障了。但是最后的预测正确率却不到40%。...成功预测的硬盘故障数量,粗略估算已覆盖SATA硬盘故障数的50%左右,进而促使5年以上服务器对业务影响的硬件整体故障率也下降了0.5%。

13.1K90

硬盘发生故障前有什么征兆

那么硬盘出现以下问题前的征兆是什么呢?告诉你如果出现下面这三个征兆就要快备份了!1、硬盘出现问题前会出现smart问题提示,这是硬盘厂家本身内置在硬盘里的自动检测功能作用。...出现这种提示就说明硬盘有潜在的物理问题,可能很快就不会正常运行了。2、在Win初始化的时候就会死机,这种情况比较复杂,导致这种情况的原因还有内存质量不够,病毒破坏等等。...只有确定是硬盘问题之后才能进行处理。3、虽然可以进入Win系统,但运行程序时总是出错,即便是运行磁盘扫描也不能正常的通过,会在扫描的时候死机。...这种情况即可能是硬盘导致,也可能是电脑系统的软件问题导致,如果排除了软件问题问题之后就说明是硬盘物理问题了。...4、在BIOS设置里无法识别硬盘,或者是即便能够识别也不能操作系统找到硬盘,这就属于比较严重的问题了。

42620

硬盘容量丢失-硬盘分区故障导致数据丢失,怎么找回?

但对于硬盘分区而言,也会有数据丢失的风险。这是因为保存数据的分区有可能遇到各种各样的故障,从而导致分区中的数据受损。怎么恢复硬盘丢失的分区数据呢?...在恢复之前硬盘容量丢失,我们先看看硬盘分区数据丢失是什么因素造成的吧。   ...一、硬盘分区故障原因   1、误操作:人为操作硬盘分区时硬盘容量丢失,误将某个分区删除,或者GHOST操作时失误将镜相恢复到了整个硬盘,分区合并成了一个盘。   ...针对硬盘数据恢复,迷你兔的硬盘恢复功能可有效处理超过2TB的大磁盘,恢复硬盘丢失的数据或硬盘分区丢失的数据。迷你兔的使用方法也非常简单,即便是新手也可以没有障碍地进行操作。   ...只是注意不要将数据直接保存在硬盘里,以免分区故障造成数据二次丢失。 本文共 722 个字数,平均阅读时长 ≈ 2分钟

1.4K20

硬盘故障时如何强制关机:Inputoutput error

如果硬盘可能会出现锁死或坏道的故障,会造成 SHELL 命令的失效,包括 reboot,powoff,,shutdown,用正常的命令是没法完成重启的。...执行这些命令,会出现如下 IO 报错: # reboot bash: /sbin/reboot: Input/output error # shurdown -r now bash: /sbin/shutdown...: Input/output error 很明显,因为硬盘故障,内核无法从磁盘上读取二进制程序 /sbin/reboot 和 /sbin/shutdown 来执行,所以命令失败。...下次启动时系统自动 fsck 可能会更正磁盘错误,但首先需要使系统重启,拉掉电源这个办法可能会造成硬盘的伤害。...可以让内核直接重启,不需要读取(已经锁死或坏掉的)硬盘,如下: 1、执行: echo 1 > /proc/sys/kernel/sysrq "magic SysRq key"提供了一个通过/proc 来直接给内核发送命令的方法

2.2K40

Nginx写IO占用高故障处理

问题描述 突然收到一台服务器负载过高告警,网站打开缓慢 问题分析 (1)使用 top 命令看到cpu行的 iowait 达到了70%以上,断定是IO负载过高的原因 (2)使用 iotop -o 命令发现...Nginx的写IO特别大,并且在上一步的top命令看到Nginx的进程状态为D,表示Nginx在等待IO已经为僵死状态 这时候可以知道是Nginx产生大量写操作导致的系统负载过高了,但还不能知道具体Nginx...,有可能与这些文件有关联 (4)使用 strace -p pid 追踪,发现nginx进程对某个fd进行大量的写操作,与 lsof 命令列出来的文件刚好符合 (5)使用 iostat 1 输出的大量写io...fastcgi_temp所在分区相符合 猜测可能是外部正在上传大量的大文件给php-fpm,于是通过EZHTTP的小工具来查看实时流量,发现入站流量其实不大 解决方案 知道了是 fastcgi_temp io

2K100

【鹅厂网事】服务器硬盘故障预测实践

我们的服务器使用年限超过5年后,硬盘故障率都是非常高。 于是乎,想快速有效的降低服务器故障的影响,核心就在于降低硬盘故障的影响。...我们对三种值进行了分析:每秒磁盘读写块数和每秒之中用于IO操作的CPU时间占的比例,通过对比多种方法,最终我们选用临近两个时间点之间的IO变化的绝对值作为主要的元数据,也就是后一个时间点与前一个时间点对应...IO差的绝对值,简称为IO跳变。...它与磁盘故障间关系如图3所示: 由上图可以看到故障时的IO跳变大小排在前10%的故障数占比66%以上,看到这个本来让我们有信心可以用它来预测磁盘故障了。但是最后的预测正确率却不到40%。...成功预测的硬盘故障数量,粗略估算已覆盖SATA硬盘故障数的50%左右,进而促使5年以上服务器对业务影响的硬件整体故障率也下降了0.5%。

1.3K10

故障分析 | 是谁偷走了我的 IO

前言 对于刚接触 MySQL 数据库不久的小伙伴来说,或多或少会遇到一些棘手的小问题;比如在数据库磁盘无损坏的情况下,我们经常会遇到数据库服务器的磁盘IO压力很大,但由于服务器上只有 MySQL 程序,...场景模拟,制造 IO 压力 ## 生成一张大表,用于测试[root@tidb-master ~]# /usr/share/sysbench/oltp_write_only.lua --mysql-host...340.99 (r/w/o: 0.00/227.00/114.00) lat (ms,95%): 38.25 err/s: 0.00 reconn/s: 0.00 问题分析 1、通过top命令发现io...消耗为52.59%,读为2.56M/s,同时线程ID 8879的写为27.31M/s(一般来说,IO列值越大,说明IO压力最有可能与其相关) Total DISK READ : 5.29 M...本文关键字:#Linux# #磁盘IO# #MySQL#

62830

服务器租用中硬盘故障的常见表现

硬盘故障可能表现为以下一些常见迹象:1. 异常噪音:硬盘传动异常会导致嘈杂的声音,如咔哒声、嘟嘟声或其他机械运动异常的声音。2....异常振动:硬盘在正常情况下应该是比较安静的,异常的振动可能暗示着硬盘发生故障。3. 速度变慢:硬盘故障可能导致文件读取或写入速度变慢,整个系统运行速度变得明显缓慢。4....SMART报警:硬盘的自我监测、分析和报告技术(SMART)可能会显示故障预警,提醒硬盘问题。7. 应用程序错误:一些应用程序可能会显示奇怪的错误或无法正常运行,这可能是由于硬盘问题导致的。8....数据丢失:数据可能突然不见了或无法访问,这种情况下很可能是硬盘发生了问题。9. 频繁的读写错误:频繁出现读取或写入错误可能会导致文件操作异常。...若您注意到了上述表现中的一项或多项,建议立即备份重要数据,并尽快联系服务提供商或数据中心支持团队,以便诊断和解决硬盘故障问题。

16220

机械硬盘随机IO慢的超乎你的想象

大家都知道硬盘的随机IO很慢,但是比顺序IO慢多少呢,不知道你是否有过数字上的直接对比。今天我来实际压测对比一下磁盘在顺序IO和随机IO不同场景下的性能数据表现。...不过IO size我只测试到了128就停了,因为再大了就越像顺序IO了。 我们还是先来看带宽,见图4: 机械硬盘即使是组成了RAID阵列,而且还有缓存,貌似对随机IO也无可奈何。...所以硬盘厂家们天天给你吹风,说他家磁盘IOPS能达到几万几万。但是他们从来闭口不提随机IO情况下,其实特么的只有200。...但是在随机IO的情况下,机械硬盘的短板就充分暴露了,零点几兆的带宽,将近5ms的延迟,IOPS只有200左右。...理解了磁盘顺序IO时候的几十M甚至一个GB的带宽,随机IO这个真的是太可怜了。 3 结论 从上面的测试数据中我们看到了机械硬盘在顺序IO和随机IO下的巨大性能差异。

1.3K40

教你如何用OpenVZ限制虚拟机硬盘IO速度

无论是KVM还是OpenVZ在SolusVM的主控端上都是没有限制硬盘IO这项功能的,KVM目前我还不是很清楚如何有效的去限制虚拟机硬盘IO,但OpenVZ目前有一个非常简单的方法可以实现,这里记录一下实现过程...打开SolusVM的主控端,找到你需要限制硬盘IO的机器,看到这台机器对应的VMID,如图所示: 然后在被控端执行如下命令: vzctl set 101 --iolimit 50M --save 注:...值得一提的是这个限制IO和取消限制都是热生效的,不需要重启虚拟机或者宿主机。...现在我们可以在虚拟机内测试一下硬盘IO限制是否生效: 在宿主机内也可以看到这台机器的IO读写限制在50M左右: 额外记录一下,关于SolusVM强制删除某一个节点的方法,在主控端的终端内执行如下命令即可

1K31
领券