腾讯云开发者社区-腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

算法channel

专栏作者

854

文章

1026974

阅读量

136

订阅数

Spark 必备基本原理

spark mapreduce 分布式 yarn node.js

不同于MapReduce将中间计算结果放入磁盘中，Spark采用内存存储中间计算结果，减少了迭代运算的磁盘IO，并通过并行计算DAG图的优化，减少了不同任务之间的依赖，降低了延迟等待时间。内存计算下，Spark 比 MapReduce 快100倍。

2019-07-15

1.4K0

hadoop|计算框架从MapReduce1.0到Yarn

hadoop mapreduce yarn 分布式

01 — HDFS 前面介绍了hadoop的分布式存储框架（HDFS），这个框架解决了大数据存储的问题，这是第一步。知道海量数据如何存储后，脚步不能停留，下一步要设计一个框架，用来玩（计算）这些数据时，资源（计算机集群）该如何调度，比如已知1PB的数据存储在了集群（1000台电脑组成）中的10台计算机（DataNode）中，现在要对这些数据进行Map和Reduce计算，该如何做呢？在理解以下知识前，需要理解一些知识点。任何应用，比如打开一个word文档，打开QQ，都会占用一定的系统资源（CPU，内存，网

2018-04-02

1.3K0

没有更多了

社区活动

腾讯技术创作狂欢月

“码”上创作 21 天，分 10000 元奖品池！

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态