Jstorm事务，实现Storm事务思想Storm 事务的核心设计思想：

Albert陈凯

发布于 2018-04-04 14:45:52

9920

发布于 2018-04-04 14:45:52

文章被收录于专栏：Albert陈凯

https://github.com/alibaba/jstorm/wiki/%E4%BA%8B%E5%8A%A1

storm的事务主要用于对数据准确性要求非常高的环境中，尤其是在计算交易金额或笔数，数据库同步的场景中。

storm 事务逻辑是挺复杂的，而且坦白讲，代码写的挺烂的。 JStorm下一步将重新设计基于Meta 1 和Meta3 的事务模型，让使用者更简便，代码更清晰。源码可以参考 jstorm-example

Storm 事务的核心设计思想：

Transaction 还是基于基本的属性之上，做的一层封装，从而满足transaction ##核心设计1 提供一个strong order，也就是，如果一个tuple没有被完整的处理完，就不会处理下一个tuple，说简单一些，就是，采用同步方式。并对每一个tuple赋予一个transaction ID，这个transaction ID是递增属性（强顺序性），如果每个bolt在处理tuple时，记录了上次的tupleID，这样即使在failure replay时能保证处理仅且处理一次 ##核心设计2 如果一次处理一个tuple，性能不够好，可以考虑，一次处理一批（batch tuples）这个时候，一个batch为一个transaction处理单元，当一个batch处理完毕，才能处理下一个batch，每个batch赋予一个transaction ID。 ##核心思想3 如果在计算任务中，并不是所有步骤需要强顺序性，因此将一个计算任务拆分为2个阶段： processing 阶段：这个阶段可以并发 commit阶段：这个阶段必须强顺序性，因此，一个时刻，只要一个batch在被处理任何一个阶段发生错误，都会完整重发batch

[

](https://github.com/alibaba/jstorm/wiki/%E4%BA%8B%E5%8A%A1#%E7%BB%93%E6%9E%9C)结果一次性从Meta或Kafka 中取出一批数据，然后一条一条将数据发送出去，当所有数据均被正确处理后，触发一个commit 流，这个commit流是严格排序，通常在commit流中进行flush动作或刷数据库动作，如果commit流最后返回也成功，spout 就更新Meta或kafka的偏移量，否则，任何一个环节出错，都不会更新偏移量，也就最终重复消费这批数据。其实，相当于把一个batch当做一个原子tuple来处理，只是中间计算的过程，可以并发。

本文参与腾讯云自媒体同步曝光计划，分享自作者个人站点/博客。

原始发表：2017.05.04 ，如有侵权请联系 cloudcommunity@tencent.com 删除

其他

本文分享自作者个人站点/博客前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

其他

登录后参与评论

0 条评论

热度