首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >Scala当中什么是RDD(Resilient Distributed Datasets)弹性分布式数据集

Scala当中什么是RDD(Resilient Distributed Datasets)弹性分布式数据集

作者头像
马克java社区
修改2019-07-16 18:06:32
修改2019-07-16 18:06:32
8000
举报
文章被收录于专栏:java大数据java大数据

RDD(Resilient Distributed Datasets)弹性分布式数据集。你不好理解的话,可以把RDD就可以看成是一个简单的"动态数组"(比如ArrayList),对其操作,也只需要 调用它的方法而已,和java中的ArrayList一样。但它与一般动态数组的区别在于:RDD是分布的。弹性是指的是数据自动在内存和磁盘切换, task如果失败会进行特定次数的重试。如果在某个节点发生错误,RDD会自动在不同的节点中重试。

更多请看:https://blog.csdn.net/qq_44596980/article/details/93308230

本文系转载,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文系转载前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档