首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

storm的作业单元:Topology

Storm系统的数据处理应用单元,是被打包的被称为Topology的作业。 它是由多个数据处理阶段组合而成的,而每个处理阶段在构造时被称为组件(Component),在运行时被称为任务。...而Topology就是这两类组件通过数据流连接的一种计算逻辑结构。(也就是说,上一个组建处理的输出结果,作为下游组件的输入数据流继续处理。如下图所示: ?...下来说明下一个Topology包含的这两种组件(Spout和Bolt): Spout:Storm中的数据源编程单元,用于为Topology生产消息(数据).一般会从外部数据源不间断地读取数据,并作为一定结构的数据项...(Tuple元祖)传递给Topology处理。...Bolt:Storm中的数据处理编程单元,实现Topology中的相关数据处理逻辑。

49620

Storm Topology及分组原理

Topology原理整理   从运行时Topology的实际执行过程角度,作业是由多个组件的实例,也即任务,按照构造时简历的逻辑顺序呢和配置的并发度,形成的数据流图结构。...Spout是Stream的源,为Topology从特定数据源获取数据项,并向作业中发射(emit)形成Stream。...createTopology(TopologyBuilder builder){ kafkaSpout kafkaspout = getKafkaSpout(topicName); //Topology...以直接指定目标组件的方式发送,可以使指定组件接收给定的Tuple.需要注意的是,接收bolt的executle()函数中,哟啊使用emitDirect()替代emit,用于向指定的具名流中发送数据项 构建Topology...构建TopologyBuilder主要给出了三类方法:创建Topology、增加bolt和增加Spout的方法。

93110

Twitter Storm: 在生产集群上运行topology

StormSubmitter的参数有:topology的名字,topology的配置对象,以及topology本身。...常见配置 有很多topology级的配置可以设。这里有关于所有配置的清单, 以”TOPOLOGY”打头的配置是topology级别的配置,可以覆盖全局级别的配置。...终止一个topology 要终止一个topology, 执行: storm kill {stormname} 其中{stormname}是提交topology给storm集群的时候指定的名字。...更新一个运行中的topology 为了更新一个正在运行的topology, 唯一的选择是杀掉正在运行的topology然后重新提交一个新的。...监控topology 监控topology的最好的方法是使用Storm UI。Storm UI提供有关task里面发生的错误以及topology里面每个组件的吞吐量和性能方面的统计信息。

21810
领券