从某云平台用户数据丢失说起

一个十亿分之一概率的事件今早引爆了朋友圈!

今早,某云对外宣传的其云服务器99.9999999%的数据可靠性,搭载了云硬盘提供三副本存储策略的云硬盘发生了故障,导致用户的数据看不到任何恢复的希望。

99.9999999%的数据可靠性,简单地说,就是十亿分之一的概率会出现数据丢失。

很不幸,这十亿分之一到了这家用户头上,成了100%。

据媒体报道,这个十亿分之一的概率发生,导致该企业的网站、小程序、H5的服务中断,近千万元级的平台数据全部丢失,包括经过长期推广导流积累起来的精准注册用户以及内容数据——包括PC网页、H5、小程序共用的核心数据。平台注册的精准用户数据全部丢失、数十万条用户帖子全部丢失、行业品牌库数据及所有录入的资讯全都丢失。

结果是——整个公司的数据无法恢复。

如何杜绝十亿分之一的概率?

以往的云灾备是从本地将数据和应用灾备到云端,或从云端灾备到云端,这样的好处是可以实现异地灾备的目标,同时还可以充分利用云平台廉价的计算、存储和网络资源。

而随着云计算平台安全性的提升以及日渐亲民的云服务价格,用户开始选择将生产系统迁移到云端,或者直接使用云端原生应用,数据生于云端,存于云端。这无疑对数据安全造成了不小的隐患,毕竟云硬盘也是硬盘,云服务器也是服务器,硬盘固件BUG问题如黑天鹅事件无法完全避免。

而从云平台本身来说,作为基础设施,更多的是需要考虑平台的整体可靠性问题,比如传统存储设备会通过RAID1到RAID6多磁盘容错的方式提高可靠性,云平台则通过多点分布式存储提高可靠性,这其中的原理不尽相同。

因此,为了数据和业务的安全,必须保证本地有最新的实时数据。这便有了针对云端数据灾备的应用场景——逆向云灾备。这个灾备模式充分利用了云主机的计算资源,在实现物美价廉的云资源服务的同时,也将关键数据实时备份到本地的备份服务器。实现“云端生产,本地灾备”。

亡羊补牢,未为晚矣。对于此次事故给广大初创公司,尤其是对那些为了节省备份容灾预算的企业是一个很好的警醒。在数据安全面前,没有创业公司,更没有万无一失的云。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180806A0JRJL00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。

扫码关注云+社区

领取腾讯云代金券