有很多不同的存储介质。举几个例子:
假设我保存了一些文件给某个媒体。我将如何计算媒体/设备在X时间单位内中断的概率,而我将无法访问内容?
是否有任何良好的来源,为不同的设备和媒体类型提供这样的统计数据和公式?
如果可能的话我想要数字和公式。使用“使用子、父和祖父类型备份方案,其中祖父被复制并存储在两个不同的安全位置”可能确实是很好的建议。但我希望能够根据一些真实世界的统计数据计算出设备/媒体失败的概率。
发布于 2009-08-29 17:04:04
让我们从硬盘开始。有三项很好的研究给出了大量的真实世界的统计数据,这些数据足以让人感兴趣:卡内基梅隆、谷歌和Netapp。意味着某种意义的统计数据是年故障率(AFR),即一个驱动器在给定的一年内失败的频率。这些研究显示,一个不令人惊讶的结果是,像失败前平均时间这样的制造商严重低估了一年内出现磁盘故障的可能性。数字是根据条件而变化的,我从中提取的经验法则是,在设备最好的情况下,你可能会达到2%的AFR,但你应该预计最坏的AFR接近10%。
如果您有两个设备具有相同数据的副本,并且它们的失败概率在统计上是独立的,那么您可以将百分比相乘,以获得两者都失败的机会。例如,如果两个硬盘的故障率为5% (合理的中间值),那么在给定的一年中,两种硬盘丢失的几率为5% * 5% = 0.25%。现在,如果两个驱动器都在同一个系统中,那么两个驱动器被取出的几率要高得多--它们远不是独立的--所以这里的实际概率在5%到0.25%之间;如果不挖掘控制器和电源故障之类的数据,就不可能接近这个值。有关这里的更多示例和背景,请参见标准RAID级别。
回到你最初的问题,其他类型的媒体呢?尽管事实证明,MTBF率对于硬盘来说是一个非常乐观的价值,但对于许多其他类型的媒体来说,这是你能找到的最好的评价。您可以使用在线可靠性计算器组合多个设备的MTBF或其近亲MTTF。您可能会发现一些真实世界的研究,您正在考虑的其他媒体类型,帮助您找到更现实的MTBF数字,而不是使用制造商的数字。
https://serverfault.com/questions/60326
复制相似问题