首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

Facebook大故障原因:一条写得很糟糕的命令、一款有缺陷的审核工具、一个阻碍成功恢复网络的DNS系统、以及严密的数据中心安全

Facebook故障是一系列不幸的事件酿成的! 一条写得很糟糕的命令、一款有缺陷的审核工具、一个阻碍成功恢复网络的DNS系统以及严密的数据中心安全,所有这些因素导致了Facebook长达 7 个小时的重大故障。 Facebook 表示,周一故障的根本原因是例行维护工作出了岔子,结果导致其DNS服务器不可使用,不过最先崩溃的是Facebook 的整个骨干网络。 雪上加霜的是,由于DNS无法使用,Facebook的工程师们无法远程访问他们所需的设备以便网络恢复正常,因此他们不得不进入数据中心手动重启系统。 这

02

Consul简单架构

Consul支持多数据中心,在上图中有两个数据中心(DateCenter),数据中心之间通过Internet互联,为了提高通信效率,只有Server节点才能加入跨数据中心的通信。   在单个数据中心中,Consul分为Client和Server两种节点(所有的节点被称为Agent)。Server节点保存数据,推荐数量是3个或者5个;Client节点负责健康检查及转发数据请求到Server。   Server节点包含一个Leader和多个Follower,Leader节点会将数据同步到Follower,在Leader挂掉的时候会启动选举机制产生一个新的Leader。   集群内的Consul节点通过gossip协议(流言协议)维护成员关系,也就说某个节点俩了解集群内现在还有哪些节点,这些节点是Client还是Server。单个数据中心的流言协议同时使用TCP和UDP通信,并且都使用8301端口。跨数据中心的流言协议也同时使用TCP和UDP通信,端口使用8302.集群内数据的读写请求既可以直接发到Server,也可以通过Client使用RPC转发到Server,请求最终会到达Leader节点,集群内数据的读写和复制都是通过TCP的8300端口完成的。

01
领券