Apache Storm 1.1.0 中文文档 | ApacheCN

前言

Apache Storm 是一个免费的,开源的,分布式的实时计算系统. 官方文档: http://storm.apache.org 中文文档: http://storm.apachecn.org

ApacheCN 最近组织了翻译 Storm 1.1.0 中文文档 的活动,整体 翻译进度 为 96%. 感谢大家参与到该活动中来 感谢无私奉献的 贡献者,才有了这份 Storm 1.1.0 中文文档 感谢一路有你的陪伴,我们才可以做的更好,走的更快,走的更远,我们一直在努力 。。。

网页地址: http://storm.apachecn.org/releases/cn/1.1.0/ github: https://github.com/apachecn/storm-doc-zh

如果您有任何意见建议,问题反馈,或者也想参与该翻译,或者想成为该项目的负责人,麻烦联系企鹅: 1042658081 技术交流企鹅群: 214293307

学习方法

1.Storm 怎么学习,怎么入门 ?

我只能悄悄的告诉你,跟着中文文档走,把文档看一遍先,文档中的概念,例子什么的先弄懂,基本上就入门

2.Storm 如何成为大神呢? 先看看大佬们的 blog 学习下,多在群里面跟别人讨论下

文档内容目录

NOTE(注意) 在最新版本中, class packages 已经从 “backtype.storm” 改变成 “org.apache.storm” 了, 所以使用旧版本编译的 topology 代码不会像在 Storm 1.0.0 上那样运行了. 通过以下配置提供向后的兼容性 client.jartransformer.class: "org.apache.storm.hack.StormShadeTransformer" 如果要运行使用较旧版本 Storm 编译的代码, 则需要在 Storm 安装中添加上述配置. 该配置应该添加到您用于提交 topologies(拓扑)的机器中. 更多细节, 请参阅 https://issues.apache.org/jira/browse/STORM-1202.

Storm 基础

Layers on Top of Storm

Storm Trident

Trident 是 Storm 的另一个 interface(接口). 它提供了 exactly-once(仅且一次)处理, “transactional(事务性的)” datastore persistence(数据存储持久化), 以及一些常见的 stream analytics operations(流式分析操作).

  • Trident 教程 – 基础的概念和预排工作
  • Trident API 概述 – 针对 transforming(转换)和 orchestrating 数据的操作
  • Trident State(状态) – exactly-once(仅且一次)处理以及 fast(快速的), persistent aggregation(持久化的聚合)
  • Trident spouts – transactional(事务性的)和 non-transactional(非事务性的)数据引入
  • Trident RAS API – 与 Trident 一起使用 Resource Aware Scheduler .

Storm SQL

该 Storm SQL 的集成可以让用户在 Storm 的 streaming data(流式数据)上来运行 SQL 查询.

NOTE(注意): Storm SQL 是一个 experimental(实验性的) 功能, 所以 Storm SQL 的结构和所支持的功能在以后可能会发生变化. 但是小的变化不会影响用户体验. 在引入 UX 更改时, 我们会及时通知用户.

Flux

Storm 安装和部署

Storm 中级

Storm 调试

Storm 与外部系统, 以及其它库的集成

Container, Resource Management System Integration

Storm 高级

结束感言

翻译过程中,大家有说有笑,有时候大家自己也不太懂,关键字啥的都会搞错,完全看不懂,一脸懵逼,醉了 。。。 但总算是把这份中文文档给弄好了吧,也算是对大家,或者对自己有一个交代,没有半途而废吧!~~~ 希望大家可以一起走的更快,走的更远 。。。

如果您有任何意见建议,问题反馈,或者也想参与该翻译,或者想成为该项目的负责人,麻烦联系企鹅: 1042658081 技术交流企鹅群: 214293307

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏社区的朋友们

TAF 必修课(七):负载均衡

前面在过载保护章节中已提及了负载均衡,顾名思义,本节要探究的对象为负载/请求。负载均衡除了起到过载预防的作用,本质上是提高了系统的吞吐量,最小化响应时间,到达资...

3420
来自专栏大数据学习笔记

Hive数据倾斜问题总结

Hive数据倾斜问题总结 1、MapReduce数据倾斜 Hive查询最终转换为MapReduce操作,所以要先了解MapReduce数据倾斜问题。 MapRe...

6378
来自专栏人工智能

分布式TensorFlow入坑指南:从实例到代码带你玩转多机器深度学习

通过多 GPU 并行的方式可以有很好的加速效果,然而一台机器上所支持的 GPU 是有限的,因此本文介绍了分布式 TensorFlow。分布式 TensorFlo...

2087
来自专栏CSDN技术头条

基于Spark的大规模机器学习在微博的应用

众所周知,自2015年以来微博的业务发展迅猛。如果根据内容来划分,微博的业务有主信息(Feed)流、热门微博、微博推送(Push)、反垃圾、微博分发控制等。每个...

2777
来自专栏鸿的学习笔记

如何设计一个良好的流系统?(上)

streaming system有两篇经典博客:streaming 101和streaming 102,深刻的描述了流系统的精髓和对未来的展望,这篇文章权当一个...

531
来自专栏张善友的专栏

负载均衡的基本算法

负载均衡的基本算法,主要有以下几种(参考F5产品): 随机:负载均衡方法随机的把负载分配到各个可用的服务器上,通过随机数生成算法选取一个服务器,然后把连接发送给...

2207
来自专栏利炳根的专栏

学习笔记 TF061 : 分布式 TensorFlow,分布式原理、最佳实践

分布式 TensorFlow 由高性能 gRPC 库底层技术支持。Martin Abadi、Ashish Agarwal、Paul Barham 论文《 Ten...

1.9K2
来自专栏腾讯开源的专栏

“轻易强快”的Spark on Angel,大数据处理爽到爆!

作者简介 游遵文 机器学习算法工程师,现任职于腾讯TEG数据平台部智能学习组,专注于机器学习算法的研究及其分布式实现,参与Angel开源项目开发及优化。 Spa...

3637
来自专栏吉浦迅科技

DAY30:阅读CPU与GPU之间的数据传输

914
来自专栏瓜大三哥

设置输入延时约束

这是一个经典的时序分析模型,上游芯片将时钟发送给FPGA,对于内部同步元件之间的可以使用create_clock进行约束,对于外部芯片发送数据通过FPGA端口到...

2239

扫码关注云+社区