首页
学习
活动
专区
工具
TVP
发布

AILearning

专栏作者
89
文章
184532
阅读量
48
订阅数
Apache Spark 2.2.0 中文文档 - Spark Streaming 编程指南 | ApacheCN
片刻
2018-01-05
2K0
Apache Zeppelin 中 HDFS文件系统 解释器
概述 Hadoop文件系统是hadoop项目的分布式,容错文件系统的一部分,通常用作Hadoop MapReduce和Apache Spark或Alluxio等底层文件系统等分布式处理引擎的存储
片刻
2018-01-05
9500
Apache Spark 2.2.0 中文文档 - Spark RDD(Resilient Distributed Datasets)论文 | ApacheCN
本文介绍了基于Apache Spark的分布式大数据处理框架,从RDD、DataFrame、Dataset、Streaming等组件的角度讲解了Spark的基本特性、架构和实现原理。同时,本文还通过多个实际应用案例,详细介绍了Spark在大数据处理、实时计算、机器学习和深度学习等领域的应用实践。此外,本文还讨论了Spark与其他大数据处理框架(如Hadoop、Storm等)的对比和选择。
片刻
2017-12-29
9610
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档