Apache Spark 2.2.0 中文文档

Apache Spark™ 是一个快速的, 用于海量数据处理的通用引擎.

官方网址: http://spark.apache.org 中文文档: http://spark.apachecn.org

花了大概两周左右的时间,在原来 Spark 2.0.2 中文文档 版本的基础上,终于迭代出该 Spark 2.2.0 中文文档 的版本了。 衷心感谢每一位参与者,感谢 ApacheCN 让我们聚在一起奋斗,我们一直在努力 。。。 网址: http://spark.apachecn.org/docs/cn/2.2.0 github: https://github.com/apachecn/spark-doc-zh (如果觉得不错,请各位大佬们给个 star) 贡献者: https://github.com/apachecn/spark-doc-zh#贡献者 建议反馈: https://github.com/apachecn/spark-doc-zh#联系方式

以下是 Spark 2.2.0 中文文档 的目录索引:

Apache Spark 2.2.0 官方文档中文版

其它中文文档:

关于学习 Spark 的部分,英文好点的话,跟着 Spark 官方文档的英文版走就行了。

如果英语不是很好,可以阅读下由 ApacheCN 组织翻译的 Spark 2.2.0 官方文档中文版

从概述开始,然后编程指南的快速入门,Spark 编程指南,Spark streaming 一步一步往下走。

文档中附带了一些基础的案例,也附带了相应的代码,可用于基础性学习,一开始不要急着写代码,先看文档,一些基本的概念懂了之后,再开始试着慢慢的写代码,即可入门 。。。

当然,学习 Spark 时最好还是有一些前置技能比较好,比如使用过 Storm 之类的,就更容易上手了。

欢迎提出任何建议,更欢迎加入我们一起来学习,Go far,go together.

欢迎转载,请注明来源:ApacheCN » Apache Spark 2.2.0 中文文档 | ApacheCN

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏腾讯大数据的专栏

后Hadoop时代的大数据架构

提到大数据分析平台,不得不说Hadoop系统,Hadoop到现在也超过10年的历史了,很多东西发生了变化,版本也从0.x进化到目前的2.6版本。我把2012年后...

38780
来自专栏喔家ArchiSelf

架构大数据应用

数据管理比以往更加复杂,到处都是大数据,包括每个人的想法以及不同的形式:广告 , 社交图谱,信息流 ,推荐 ,市场, 健康, 安全, 政府等等。 过去的三年里,...

21820
来自专栏PPV课数据科学社区

多图技术贴 | 深入浅出解析大数据平台架构

参加活动赢取话费和一个月免费会员 点击底部阅读原文,参加PPV课玩转可视化图表,赢取话费和PPV课一个月免费会员,精品课程免费看! 目录: 什么是大数据 Had...

40540
来自专栏Hadoop数据仓库

HAWQ取代传统数仓实践(一)——为什么选择HAWQ

        为了跟上所谓“大数据”技术的脚步,从两年前开始着手实践各种SQL-on-Hadoop技术,从最初的Hive,到SparkSQL,再到Impala...

43080
来自专栏james大数据架构

0基础搭建Hadoop大数据处理-初识

  在互联网的世界中数据都是以TB、PB的数量级来增加的,特别是像BAT光每天的日志文件一个盘都不够,更何况是还要基于这些数据进行分析挖掘,更甚者还要实时进行数...

22270
来自专栏PPV课数据科学社区

【聚焦】后Hadoop时代的大数据架构

提到大数据分析平台,不得不说Hadoop系统,Hadoop到现在也超过10年的历史了,很多东西发生了变化,版本也从0.x进化到目前的2.6版本。我把2012年后...

30440
来自专栏大数据文摘

后Hadoop时代的大数据架构

26650
来自专栏精讲JAVA

什么是Hadoop,怎样学习Hadoop(文尾有福利)

转自java知音 概述:Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的...

209100
来自专栏张善友的专栏

微软用于大数据管理、分析和挖掘的Hadoop发布版HDInsight

SQL Server 2012与SQL Server 2008最重要的区别之一就是与Hadoop的兼容性。Hadoop允许用户处理大量的结构化和非结构化数据并快...

24390
来自专栏华章科技

国外、国内Hadoop的应用现状

摘要:Hadoop是一个开源的高效云计算基础架构平台,其不仅仅在云计算领域用途广泛,还可以支撑搜索引擎服务,作为搜索引擎底层的基础架构系统,同时在海量数据处理、...

26320

扫码关注云+社区

领取腾讯云代金券