2017国外10大云故障盘点:亚马逊、Facebook、IBM等

下面是盘点出的2017年国外10大云故障,提醒人们,这个快速成熟的行业,其出色运营的风险比以往任何时候都要高:

IBM,1月26日

今年年初,IBM云的可信度受到打击,当时客户用于访问Bluemix云基础设施的一个管理门户出现数小时的故障。

虽然底层基础设施没有发生故障,但是客户沮丧地发现,他们无法管理他们的应用、无法添加或者移除为工作负载提供支持的云资源。

GitLab,1月31日

GitLab广受欢迎的在线代码库GitLab.com遭遇了18个小时的服务中断,最终还是没有完全修复。这次故障主要原因是,一位员工在维护流程中将一个数据库目录从错误的数据库服务器中删除导致的。

GitLab事后表示,最乐观的估计是,这次故障影响了大约5000个项目、5000条评论和700个新用户帐户。

Facebook,2月2日

在漫长而痛苦的三个小时中,全球各地的一些用户被锁在Facebook之外,担心他们的帐户被黑客入侵。

社交媒体巨头Facebook随后解释说,有功能将会防范黑客发送给用户一个恢复屏幕,让人感觉有人登录了他们的帐户,受影响的用户会被阻止立即重新登录。

AWS,2月28日

这是一次震动整个业界的故障事件。一位AWS工程师试图对位于弗吉尼亚州数据中心内的一个S3存储系统进行调试的时候,意外地输入了一个错误命令行,随后大部分互联网,包括Slack、Quora和Trello在内的很多企业平台停机了4个小时。

调查显示,该员工使用既定的步骤,试图关闭少量托管了计费流程子系统的服务器。相反,意外的命令导致更大范围服务器处于脱机状态,其中包括为服务器提供特定数据存储所需的一个子系统,以及另一个分配新存储的子系统。

这次由这样一家几乎占据了全球1/3云市场份额的提供商导致的故障,重新引发了关于公有云风险的争论。

微软,3月16日

存储可用性问题困扰了微软Azure公有云超过8个小时,主要影响到美国东部的一些客户。一些用户无法配置新存储或者访问该地区的现有资源。随后一个微软工程团队将这次故障归咎于一个存储集群端点并出现不可用的情况。

除了该问题之外,微软还在Azure状态页面上列出了一个软件错误,使得多个服务的存储配置受影响超过1个小时。

微软Office 365,3月21日

由于用户身份验证问题,导致多个微软企业和消费级云服务(包括Office 365存储和电子邮件服务)无法使用。

这次受影响广泛的故障使得客户无法访问OneDrive存储、Skype协作、Outlook电子邮件、以及像Xbox Live这样的消费级产品。

苹果iCloud,6月28日

有多个社交媒体来源报道称,苹果iCloud Backup服务出现了可用性故障。平台的系统状态页面显示,iCloud Backup只影响了不到1%的用户。

在这次故障中,受影响的用户无法从之前的备份中恢复iOS设备,持续了至少36小时。虽然恢复过程会被挂起无法完成,但是启动新的设备备份以保护数据是没有问题的。

AWS,9月14日

虽然9月份发生的这起AWS服务远不如2月份的那么严重,但事实上这次故障影响了S3存储服务,且源自于同一个US-EAST-1地区,足以引起人们对半年前灾难性事件的不愉快回忆。

访问存储块出现问题,从当天中午开始引起人们的注意,并在东部时间下午1点前得到控制。

微软Azure,9月29日

当天欧洲的客户无法使用微软Azure公有云中的一些服务长达7个小时。这次让北欧第二大云计算提供商出现故障的原因是意外启动了灭火系统。微软表示,对系统的日常维护工作导致灭火气体释放,自动出发空调系统关闭,从而让设备温度升高,迫使计算机系统自动关闭。

Google Docs,11月15日

有数千位Google Docs用户遭遇了服务中断,导致他们的业务受到影响。

这次停机是从东部时间下午4点之前开始的,持续了30分钟到1个小时的时间。Google证实,这次故障影响了一个“重要用户子集”,备受欢迎的文档创建和编辑工具也无法访问文件。

Google表示,在周三晚上对于大多数用户来说Google Docs服务已经恢复。

Google的一家合作伙伴表示,在其400家企业客户中,有6家受到这次故障的影响。这家解决方案提供商,同时也是Google用户,本身也受到了影响。

原文发布于微信公众号 - BestSDK(bestsdk)

原文发表时间:2018-01-07

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏新智元

谷歌IBM等8家技术公司推出开源API Grafeas,统一管理软件供应链

【新智元导读】谷歌、IBM 和其他一些科技公司联合推出了开源 API Grafeas,能够存储、查询和检索所有类型软件组件的重要元数据,帮助企业构建规模尺度上...

3276
来自专栏媒矿工厂

优化延迟的最佳视频传输方案(二)

上一篇文章《优化延迟的最佳视频传输方案(一)》介绍了在整个视频传输系统中的分发链前端和媒体内容准备方面的延迟优化方案,本文将继续介绍传输系统的接下来的优化方案,...

1672
来自专栏技术翻译

10必须了解托管云服务对业务增长的好处

根据MarketsandMarkets™关于托管云服务的报告,“云托管服务市场规模预计将从2017年的271.5亿美元增长到2022年的537.8亿美元,预计复...

1683
来自专栏ThoughtWorks

2015.1 技术雷达 | 技术篇

许多项目都存在外部代码依赖,这些依赖中很大一部分是由开源项目提供的。为了确保构建过程可被重现,我们总是与固定版本的外部依赖进行集成。但这就意味着我们与这些类库的...

3557
来自专栏软件测试经验与教训

张老师聊面试(二)

小梅,毕业一年,从实习到现在都在一家外包单位工作,做的是手机测试和定制软件的测试,由于工作单调,且没有成长空间,因此考虑换一份工作。但几次面试都不太顺利。

1021
来自专栏大数据钻研

2018最具就业前景的7大编程语言,Java、Python和JavaScript?

2018 年即将到来,Coding Dojo(编码道场)近期发布了 2018 最具就业前景的 7 大编程语言。该公司分析了来自 Indeed 的 25 门编程语...

5077
来自专栏Java学习网

论编程的最后期限

普通编程与专业编程之间有很多差别,而最为显著的就是截止日期。 截止日期 / 最后期限   当你给自己写程序的时候,只要你愿意,就可以用很多(或者很少)的时间来...

3437
来自专栏Java社区

从0开发前后端分离的企业级上线项目

1902
来自专栏知晓程序

清单控必备!有了这款小程序,碎片时间也能轻松涨知识

今天,知晓程序(zxcx0101)就推荐一款碎片化阅读和知识分享平台「清单 plus」,让你在短时间内迅速收获经验和知识。

601
来自专栏云计算D1net

控制云访问的5个简单的步骤

企业IT管理人员要如何才能带来对于公共云服务的使用的秩序和问责制,同时又不影响进程的处理呢?每一种技术的成功故事也是一个后果意想不到的故事。例如,采取虚拟化技术...

37910

扫码关注云+社区

领取腾讯云代金券