Apache Storm 1.1.0 中文文档 | ApacheCN

前言

Apache Storm 是一个免费的,开源的,分布式的实时计算系统. 官方文档: http://storm.apache.org 中文文档: http://storm.apachecn.org

ApacheCN 最近组织了翻译 Storm 1.1.0 中文文档 的活动,整体 翻译进度 为 96%. 感谢大家参与到该活动中来 感谢无私奉献的 贡献者,才有了这份 Storm 1.1.0 中文文档 感谢一路有你的陪伴,我们才可以做的更好,走的更快,走的更远,我们一直在努力 。。。

网页地址: http://storm.apachecn.org/releases/cn/1.1.0/ github: https://github.com/apachecn/storm-doc-zh

如果您有任何意见建议,问题反馈,或者也想参与该翻译,或者想成为该项目的负责人,麻烦联系企鹅: 1042658081 技术交流企鹅群: 214293307

学习方法

1.Storm 怎么学习,怎么入门 ?

我只能悄悄的告诉你,跟着中文文档走,把文档看一遍先,文档中的概念,例子什么的先弄懂,基本上就入门

2.Storm 如何成为大神呢? 先看看大佬们的 blog 学习下,多在群里面跟别人讨论下

文档内容目录

NOTE(注意) 在最新版本中, class packages 已经从 “backtype.storm” 改变成 “org.apache.storm” 了, 所以使用旧版本编译的 topology 代码不会像在 Storm 1.0.0 上那样运行了. 通过以下配置提供向后的兼容性 client.jartransformer.class: "org.apache.storm.hack.StormShadeTransformer" 如果要运行使用较旧版本 Storm 编译的代码, 则需要在 Storm 安装中添加上述配置. 该配置应该添加到您用于提交 topologies(拓扑)的机器中. 更多细节, 请参阅 https://issues.apache.org/jira/browse/STORM-1202.

Storm 基础

Layers on Top of Storm

Storm Trident

Trident 是 Storm 的另一个 interface(接口). 它提供了 exactly-once(仅且一次)处理, “transactional(事务性的)” datastore persistence(数据存储持久化), 以及一些常见的 stream analytics operations(流式分析操作).

  • Trident 教程 – 基础的概念和预排工作
  • Trident API 概述 – 针对 transforming(转换)和 orchestrating 数据的操作
  • Trident State(状态) – exactly-once(仅且一次)处理以及 fast(快速的), persistent aggregation(持久化的聚合)
  • Trident spouts – transactional(事务性的)和 non-transactional(非事务性的)数据引入
  • Trident RAS API – 与 Trident 一起使用 Resource Aware Scheduler .

Storm SQL

该 Storm SQL 的集成可以让用户在 Storm 的 streaming data(流式数据)上来运行 SQL 查询.

NOTE(注意): Storm SQL 是一个 experimental(实验性的) 功能, 所以 Storm SQL 的结构和所支持的功能在以后可能会发生变化. 但是小的变化不会影响用户体验. 在引入 UX 更改时, 我们会及时通知用户.

Flux

Storm 安装和部署

Storm 中级

Storm 调试

Storm 与外部系统, 以及其它库的集成

Container, Resource Management System Integration

Storm 高级

结束感言

翻译过程中,大家有说有笑,有时候大家自己也不太懂,关键字啥的都会搞错,完全看不懂,一脸懵逼,醉了 。。。 但总算是把这份中文文档给弄好了吧,也算是对大家,或者对自己有一个交代,没有半途而废吧!~~~ 希望大家可以一起走的更快,走的更远 。。。

如果您有任何意见建议,问题反馈,或者也想参与该翻译,或者想成为该项目的负责人,麻烦联系企鹅: 1042658081 技术交流企鹅群: 214293307

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏zzzz

学hadoop需要什么基础

最近一段时间一直在接触关于hadoop方面的内容,从刚接触时的一片空白,到现在也能够说清楚一些问题。这中间到底经历过什么只怕也就是只有经过的人才会体会到吧。前几...

11810
来自专栏BestSDK

解密个推SDK如何完成百亿级覆盖量推送

精彩内容 作为推送行业领导者,截止目前个推SDK累计安装覆盖量达100亿(含海外),接入应用超过43万,独立终端覆盖超过10亿 (含海外)。个推系统每天会产生大...

33260
来自专栏PPV课数据科学社区

浅谈开源大数据平台的演变

一说到开源大数据处理平台,就不得不说此领域的开山鼻祖Hadoop,它是GFS和MapReduce的开源实现。虽然在此之前有很多类似的分布式存储和计算平台,但真正...

40260
来自专栏编程坑太多

『中级篇』CI/CD持续集成/持续部署(69)

PS:本人的目标CICD的整个流程,可以自己搭建一套小公司内部的流程,方便开发人员和测试使用。

37720
来自专栏积累沉淀

storm概述

1.Storm是什么,应用场景有哪些?        2.Storm有什么特点?        3.spout发出的消息后续可能会触发产生成...

25190
来自专栏大数据钻研

年薪50W大数据工程师入门学习路线

视频方面: 推荐《毕向东JAVA基础视频教程》。学习hadoop不需要过度的深入,java学习到javase,在Java虚拟机的内存管理、...

22940
来自专栏PPV课数据科学社区

【平台】[Kafka系列]Kafka在大数据生态系统中的价值

? 作者 Jun Rao 为ODBMS撰写文章的转载。译者 Brian Ling,专注于三高(高性能,高稳定性,高可用性)的码农。 近几年, Apache K...

430140
来自专栏腾讯大数据的专栏

浅谈开源大数据平台的演变

一说到开源大数据处理平台,就不得不说此领域的开山鼻祖Hadoop,它是GFS和MapReduce的开源实现。虽然在此之前有很多类似的分布式存储和计算平台,但...

33160
来自专栏智能计算时代

微软数据湖架构

一个无限制的数据湖为智能行动提供动力: 存储和分析PB级大小的文件和数以万亿计的对象 开发大规模并行程序简单 调试和优化您的大数据程序轻松 企业级安全,审计和支...

59530
来自专栏安全领域

启动物联网项目所需的一切:第 1 章

本文旨在帮助读者围绕物联网或流处理系统的技术问题,建立完整的基础和多方面的理解。

81280

扫码关注云+社区

领取腾讯云代金券