腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
牛肉圆粉不加葱
专栏作者
举报
94
文章
84968
阅读量
19
订阅数
订阅专栏
申请加入专栏
全部文章
其他
spark
java
人工智能
sql
yarn
编程算法
jvm
api
apache
缓存
微信
python
scala
linux
apt-get
存储
hive
zookeeper
rpc
大数据
数据结构
https
机器学习
javascript
node.js
css
json
ide
github
神经网络
深度学习
批量计算
TDSQL MySQL 版
http
网络安全
markdown
安全
机器人
数据分析
数据处理
windows
hbase
kafka
task
搜索文章
搜索
搜索
关闭
Spark Task 内存管理(on-heap&off-heap)
spark
jvm
java
在之前的文章中(Spark 新旧内存管理方案(上)及Spark 新旧内存管理方案(下)),我从粗粒度上对 Spark 内存管理进行了剖析,但我们依然会有类似这样的疑问,在 task 中,shuffle 时使用的内存具体是怎么分配的?是在堆上分配的还是堆外分配的?堆上如何分配、堆外又如何分配?
codingforfun
2018-08-24
989
0
【源码剖析】- Spark 新旧内存管理方案(上)
spark
缓存
jvm
Spark 作为一个以擅长内存计算为优势的计算引擎,内存管理方案是其非常重要的模块。作为使用者的我们,搞清楚 Spark 是如何管理内存的,对我们编码、调试及优化过程会有很大帮助。本文之所以取名为 "Spark 新旧内存管理方案剖析" 是因为在 Spark 1.6 中引入了新的内存管理方案,加之当前很多公司还在使用 1.6 以前的版本,所以本文会对这两种方案进行剖析。
codingforfun
2018-08-24
317
0
JVM GC 那些事(二)- 堆上的内存分配机制
jvm
编程算法
前一篇文章JVM GC 那些事(一)- JVM 运行时内存划分介绍了 JVM 运行时的内存划分情况。本文将介绍 JVM GC “主战场” 堆上的内存分配机制。
codingforfun
2018-08-24
537
0
[Spark源码剖析]Spark 延迟调度策略
spark
jvm
人工智能
在 Spark 中,若 task 与其输入数据在同一个 jvm 中,我们称 task 的本地性为 PROCESS_LOCAL,这种本地性(locality level)是最优的,避免了网络传输及文件 IO,是最快的;其次是 task 与输入数据在同一节点上的 NODE_LOCAL,数据在哪都一样的 NO_PREF,数据与 task 在同一机架不同节点的 RACK_LOCAL 及最糟糕的不在同一机架的 ANY。
codingforfun
2018-08-24
948
0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档