专栏首页linux驱动个人学习硬盘写到一半时断电,文件系统里会发生什么?

硬盘写到一半时断电,文件系统里会发生什么?

知乎问题:

断电时文件系统发生了什么?硬盘又发生了什么?下一次开机时写到一半的文件在系统层面还在吗?在底层还在吗?

更进一步的, 文件系统如何保证事务性, 会不会存在某种极端情况导致例如最后几个bit还没写完, 文件系统却认为它成功了的情况?

回答不限任何文件系统,谢谢!

作者「北极」的回答:

断电的一瞬间,很多事情是无法确定的:

1.你无法确定你试图向设备驱动发送的写指令是否成功,驱动程序本身一般都有缓存;

2. 即使写指令正常返回,你也无法确定设备实际上是否写成功,因为设备本身可能也有缓存。目前没有设备能保证写指令返回的情况下,所有数据一定成功的保存在介质上(但部分厂商能保证少量数据一定能成功写入),对存储设备的flush操作并非绝对可靠;

3. 哪些成功哪些失败可能是乱序的,换句话说,如果先发送写请求A,再发送写请求B,并且都成功返回,掉电时请求A可能丢失,但B成功(NCQ功能);

4. 机械式磁盘可能会出现丢失半截数据的情况(比如,一个512字节扇区只写入了100字节,也就是题主说的bit级错误),但这种一般都会通过校验位检测出来。

因为有以上这么多的限制,实际上文件系统一般没办法保证数据一定不丢失,甚至哪些丢失哪些能恢复也是不确定的。

一般来说,文件系统有以下的几种策略:

1. 完全不管错误的事情,错了就错了;

2. 打标记位的方式,如果怀疑有错,通过磁盘检测功能恢复;

3. 在设计上保证文件系统结构上可恢复,但不保证用户数据可恢复;

4. 能在用户数据层面上保证数据的绝对正确。

第一种和第二种策略现在比较少见,FAT文件系统算是属于这类;主流文件系统基本上都能保证第三种,比如NTFS之类的;第四种比较难,一般都要配合存储驱动一起,多见于Flash介质的专属文件系统。

保证数据不损坏,具体的方案一般有:

方案1:Copy-On-Write,写数据的时候不在原来的位置写,而是先读一份,然后写到另外一个位置,当确认写成功时,把文件系统的指针指向新的位置。如下图:

实际应用中,比这个情况复杂,因为Data2写入的过程中,File1本身的一些信息(修改时间等)也发生了变化,所以CopyOnWrite产生的影响不止这一个块,而是很多。

方案2:日志(Journal)技术。使用日志记录meta-data甚至是数据块的变化情况(NTFS就是这种策略),一旦出现掉电情况,在日志中反推到一个正确的状态上,就可以保证meta-data不损坏。

常见的方案就这两种,当然还有别的更复杂的技术,可以参考这个链接(Comparison of file systems),但不管用什么方案,本质上都是以牺牲性能为代价换取结构上的稳定。

最后回到题主的问题,文件系统如何保证数据的正确性?如果是指文件的数据部分,是无法保证的,因为文件系统无法确定数据到底写没写进去,绝大多数文件系统只能保证自身结构是正确的,但这个正确可能是回滚之后的状态,具体回滚多少内容,文件系统自己也不能保证。

这事说起来挺复杂的,不同文件系统,不同设备,不同介质,效果都是有区别的。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 爱炫耀的数据库老头儿

    作者:刘欣 1 数据库老头儿 我们这个世界很大, 生活着很多人,形形色色,各怀绝技。但是被公认为最拽的一个却是数据库老头儿,年龄挺大,每天都要炫耀几遍他那关系型...

    企鹅号小编
  • CPU的中断

    中断其实就是由硬件或软件所发送的一种称为IRQ(中断请求)的信号。中断允许让设备,如键盘,串口卡,并口等设备表明它们需要CPU。

    陈不成i
  • 聊聊运维应该了解的一些内核知识

    本文主要是《Linux内核设计与实现》这本书的读书笔记,这本书我读了不下十遍,但依然感觉囫囵吞枣。我结合自己的理解,从这本书中整理出了一些运维应该了解的内核知识...

    力哥聊运维与云计算
  • 详解MBR篡改技术

    机械磁盘在物理结构上是由磁片、马达、磁头、定位系统等部件构成,通常一块磁盘有若干块磁片构成,为了方便定位统一管理,将这些磁片进行了编号。一个盘片的两面各有一个磁...

    FB客服
  • 关于睡眠和休眠

    到底用睡眠和休眠,还是直接关机的问题,争论颇多,大家各有各的观点和立场。实际上在很长一段时间内我本人的态度也是变化了不少,在此我想说说我对这个问题的看法,简要分...

    williamwong
  • 相克军_Oracle体系_随堂笔记002-基础

    图2-1可以说是标准的生产库环境,处处体现了冗余,有效防止了单点故障。这就是HA(高可用)

    Alfred Zhao
  • 第二回:内存揭奥秘,总线解玄机

    “没错,我这里不是久留之地,一旦断电了数据就都消失了。硬盘可以持久化存储数据,就算没有供电,数据也依然存在,你要是能到那里就安全了”,内存说到。

    轩辕之风
  • 数据库漫谈(二)

    本文作者系Scott(中文名陈晓辉),现任大连华信资深分析师 ,ORACLE数据库专家,曾就职于甲骨文中国。个人主页:segmentfault.com/u/db...

    SQLplusDB
  • 聊聊这个让腾讯云丢数据的“静默损毁”

    今早刚看到一则新闻,说是腾讯云丢了某个客户的数据,原因是硬盘bug导致“写进去的数据读出来并不是之前写入的数据”,当然,不管具体是不是这个原因,详情如何,不做评...

    冬瓜哥
  • 写在硬盘暴废之后

    2018 年 11 月 12 日下午,踢完球回到宿舍后,发现正在下电影的 qBittorrent 报错:input/output error(只记得这部分)。由...

    莲花海
  • 手把手教你安装 Win+Ubuntu 双系统(图文教程)

    在大多数情况下,对于一个程序开发人员,电脑的操作系统的最佳选择不应该是 Windows,而是 Mac 或者 Linux。

    猴哥yuri
  • 将移动硬盘上的archlinux复制到笔记本电脑硬盘并引导

    将移动硬盘上的archlinux复制到笔记本电脑硬盘并引导 每次安装archlinux我都非常痛苦,在同事的协助下才能完成。为了避免这个问题,我在我的移动硬盘上...

    FungLeo
  • 谁让存储的未来不再忧伤?我们来细品一二

    半导体技术的出现和普及,让存储介质与存储模式发生了翻天覆地的变化,使用二进制记录和存储数据成为整体存储模式的主流。

    用户6543014
  • 黑群晖常见问题集锦

    答:群晖系统跟Windows不同,Windows有个盘要当成系统盘,而群晖会在每个硬盘上自动安装系统。每个硬盘?对,没错,就是每个硬盘。比如你是6盘位,接了6个...

    风吹屁屁凉
  • FPGA逻辑设计回顾(11)FPGA以及PC中的RAM与ROM

    DDR也是计算机中的元素,当然在我们的FPGA中也广泛使用,在科普了它们的渊源,它们的基础知识后,我们便可以接着讲它在FPGA中的应用,它的使用方式,乃至它的设...

    Reborn Lee
  • 菜鸟,请你们真爱生命,远离Proteus

    *注:此文专为21IC而著,可以转载,但需保留本说明,否则将可能导致版权追究 Proteus可能是本版面最受争议的软件之一,我骂他,同时也因为骂他而受别人骂,...

    单片机技术宅
  • CPU阿甘

    我是CPU, 他们都叫我阿甘, 因为我和《阿甘正传》里的阿甘一样, 有点傻里傻气的。

    用户1564362
  • 物理入侵之你真的敢用的我的U盘么?

    lonelyvaf
  • 如何让一个2008年的电脑可以正常服役

    这个系统基本是可以顶替百分之80的Windows系统,成为一个可以让你办公加休闲的一个系统,并且这个系统对一个新手来说毫无难度,半天可以上手办公,Deepin是...

    JAVA葵花宝典

扫码关注云+社区

领取腾讯云代金券