行百里者半九十,文件写90%崩了呢?

上篇文章我们介绍了第一个文件格式:

什么是文件格式?

在这里没有对文件有任何的异常处理。假如文件写坏了怎么办?如果一个文件很大,比如你在下片,好几个G,下到一半网断了,是不是很崩溃?这时候就需要断点续传。本文介绍一种文件的断点恢复方法:实现Undo日志。

文件的恢复其实是一种 undo 日志。将文件的内容分成一个一个,每一个可以看成是一个事务,当事务完成时记录检查点。在数据库中,假如一个事务做了一半系统挂掉,可以根据 undo 日志将数据项设置为旧值。类似微信的撤销消息(因为要记录日志,为了减少空间占用,所以微信将其限制在了2分钟,我猜的)。

写文件的 undo 日志很容易实现,记录每个完整小块的结尾位置。一旦出现错误,直接将最新检查点位置后边的不完整数据删掉。java 中一般用 truncate 方法截断文件。

举个例子,每个由 4 个字节组成,每写完 1 个块,就在另一个文件中记录一个当前文件的最新位置。比如写了5个块,共 20 个字节,检查点记录了五个:4,8,12,16,20。这时候又写了 2 个字节,崩了。

为了继续写文件,需要根据检查点的 20,将文件从 20 处截断。

java nio FileChannel 的 truncate 可以干这个事,RandomAccessFile 和 FileOutputStream 都可以获得当前 FileChannel。

此外,RandomAccessFile 还可以直接用 setLength()。他们都接收一个 long 类型的文件长度,这个位置之后的内容都会被丢弃。

那么截断后怎么继续写呢?一种很简单的方式是使用 append 模式开一个 FileOutputStream,继续在文件末尾写数据就好了。

总结

今天介绍了一种文件的错误恢复方式,这种方式依赖一个日志文件,这个日志文件也可以换成一个数据库。记检查点的频率会影响写文件的效率,也会影响错误恢复时丢失的数据量,需要自己平衡。

之前我们有讨论过 RandomAccessFile 可以直接定位到文件的某个位置写新的数据,看起来也可以进行断点恢复,但是需要保证新写的数据比需要截断的数据长。

代码:

https://github.com/qiaojialin/Java-IO-Learning

关注DBDeveloper,跟乔老师学数据库!

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180611G0UPB600?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券