前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >第3章 Spark性能优化

第3章 Spark性能优化

作者头像
sparkle123
发布2018-06-06 15:58:58
3980
发布2018-06-06 15:58:58
举报
3.2、诊断内存的消耗

image.png

image.png

3.3、高性能序列化类库

image.png

image.png

image.png

image.png

image.png

3.4、优化数据结构

image.png

image.png

  • map等集合除了有对象头还有entry指针额外的信息

尽量使用string

优化数据结构

3.5、对多次使用的RDD进行持久化或Checkpoint

image.png

image.png

3.6、使用序列化的持久化级别

image.png

3.7、Java虚拟机垃圾回收调优

image.png

image.png

image.png

image.png

3.8、提高并行度

image.png

image.png

3.9、广播共享数据

image.png

3.10、数据本地化

image.png

image.png

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2018.06.01 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 3.2、诊断内存的消耗
  • 3.3、高性能序列化类库
  • 3.4、优化数据结构
  • 3.5、对多次使用的RDD进行持久化或Checkpoint
  • 3.6、使用序列化的持久化级别
  • 3.7、Java虚拟机垃圾回收调优
  • 3.8、提高并行度
  • 3.9、广播共享数据
  • 3.10、数据本地化
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档