首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

Storm的故障容忍性

本文讲解了Storm故障容忍性(Fault-Tolerance)的设计细节:当Worker、节点、Nimbus或者Supervisor出现故障时是如何实现故障容忍性,以及Nimbus是否存在单点故障问题...如果这个Worker连续在启动时失败,并且无法让Nimbus观察到它的心跳,Nimbus将这个Worker重新分配到另一台机器上。 当一个节点挂了会怎样?...分配给这台机器的任务将会超时,并且Nimbus将这些任务重新分配给其它机器。 当Nimbus或者Supervisor daemon进程挂了会怎样?...Nimbus是否有单点故障? 当你丢失了Nimbus节点,Worker将依然可以继续工作。此外,Supervisor将可以继续重启挂掉的Worker。...Nimbus deamon进程挂掉不会引起任何灾难发生。在将来,计划将Nimbus设计成高可用。 Storm如何保证数据处理?

25320

【Storm篇】--Storm 容错机制

其中各个组件的作用如下: Nimbus 资源调度 任务分配 接收jar包 Supervisor 接收nimbus分配的任务 启动、停止自己管理的worker进程(当前supervisor上worker...所以当程序提交完后,任务信息都存储在zookeeper里面,即使nimbus宕机,程序依然会继续执行。...三、容错机制 从以下三个方面考虑: 1、集群节点宕机(集群角度) Nimbus服务器 单点故障时可以添加报警,但程序银镜加载到内存中运行了。...非Nimbus服务器 故障时,该节点上所有Task任务都会超时,Nimbus会将这些Task任务重新分配到其他服务器上运行 2、进程挂掉 Worker 挂掉时,Supervisor会重新启动这个进程。...如果启动过程中仍然一直失败,并且无法向Nimbus发送心跳,Nimbus会将该Worker重新分配到其他服务器上 Supervisor 无状态(所有的状态信息都存放在Zookeeper中来管理) 快速失败

1K40

大数据干货系列(七)-Storm总结

和Supervisor之间的所有协调工作都是通过Zookeeper集群完成 • Nimbus进程和Supervisor进程都是快速失败(fail-fast),即可以用kill -9来杀死Nimbus和Supervisor...• Nimbus进程和Supervisor进程都是无状态的。...最重要的是,worker进程不会因为Nimbus或者Supervisor挂掉而受影响。这跟Hadoop是不一样的,当JobTracker挂掉,所有的任务都会没了。 1)当Nimbus挂掉会怎样?...如果启动一直失败那么此时worker也就不能和Nimbus保持心跳了,Nimbus会重新分配worker到其他机器。 4) Nimbus存在单点问题吗?...但是,没有了Nimbus,当需要的时候(如果worker机器挂掉了),worker就不能被重新分配到其他机器了。 所以答案是,Nimbus在“某种程度”上属于单点故障的。

78770

【转】storm和zookeeper中的节点的关系

一、Nimbus Nimbus既需要在Zookeeper中创建元数据,也需要从Zookeeper中获取元数据。...如上图箭头1所示: 1、对于路径a,Nimbus只会创建路径,不会设置数据,数据是稍后由Worker设置的。 2、对于路基b和c,Nimbus在创建她们的时候就会设置数据。...如上图箭头2所示: 1、Nimbus需要从路径a读取当前已经被分配的Worker的运行状态。根据该信息,Nimbus可以得知哪些Worker状态正常,哪些需要被重新调度。...这个路径是Nimbus写入的对Topology的任务分配信息,Supervisor从该路径可以获取到Nimbus分配给它的所有任务。...Nimbus会每隔一段时间获取该路径下的数据,同时Nimbus还会在它的内存中保存上一次的信息。

93120
领券