腾讯云开发者社区-腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

码的一手好代码

专栏作者

68

文章

89398

阅读量

18

订阅数

设计模式七大原则

spark css 缓存编程算法

累加器（Accumulator）是Spark提供的累加器，顾名思义，该变量只能够增加。由Driver端进行初始变量，Task再对声明的变量进行累加操作。

俺也想起舞

2019-11-27

4460

Spark中累加器的陷阱

spark css 缓存编程算法

累加器（Accumulator）是Spark提供的累加器，顾名思义，该变量只能够增加。由Driver端进行初始变量，Task再对声明的变量进行累加操作。

俺也想起舞

2019-11-27

9140

Spark中的持久化

文件存储 spark 缓存 java 存储

Spark 中一个很重要的能力是将数据持久化（或称为缓存），在多个操作间都可以访问这些持久化的数据。当持久化一个 RDD 时，每个节点的其它分区都可以使用 RDD 在内存中进行计算，在该数据上的其他 action 操作将直接使用内存中的数据。这样会让以后的 action 操作计算速度加快（通常运行速度会加速 10 倍）。缓存是迭代算法和快速的交互式使用的重要工具。

俺也想起舞

2019-11-27

6580

HBase设计结构和原理

hbase TDSQL MySQL 版 html zookeeper 缓存

既然是Write-Ahead-Log，为何先写内存再写WAL？先写内存的原因：HBase提供了一个MVCC机制，来保障些数据阶段的数据可见性。先写MemStore再写WAL，是为了一些特殊场景下，内存中的数据能够更及时的返回。如果先写WAL失败的话，MemStore助攻的数据会被回滚。

俺也想起舞

2019-07-25

1.9K0

Spark内部原理

mapreduce 文件存储缓存 spark 编程算法

Spark中的Shuffle、宽依赖窄依赖、RDD持久化、共享变量

俺也想起舞

2019-07-24

7310

没有更多了

社区活动

腾讯技术创作狂欢月

“码”上创作 21 天，分 10000 元奖品池！

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态