腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
肖力涛的专栏
专栏作者
举报
10
文章
36674
阅读量
38
订阅数
订阅专栏
申请加入专栏
全部文章(10)
spark(5)
人工智能(4)
大数据(4)
机器学习(2)
c++(2)
神经网络(2)
深度学习(2)
java(1)
数据库(1)
云数据库 SQL Server(1)
分布式(1)
hadoop(1)
数据处理(1)
hbase(1)
搜索文章
搜索
搜索
关闭
Spark 踩坑记:从 RDD 看集群调度
spark
分布式
大数据
本文介绍了分布式数据集(RDD)的数学定义和原理,并详细讲解了 Apache Spark 的 RDD 实现。作者通过举例介绍了 RDD 的三种主要转换操作,并探讨了在 Spark 集群环境下,如何通过 RDD 进行分布式计算。最后,本文介绍了在 PySpark 中如何使用 RDD 进行分布式流处理。
肖力涛
2017-08-15
2.1K
0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档