首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >MapReduce工作笔记——Job调度参数设置

MapReduce工作笔记——Job调度参数设置

作者头像
莫斯
发布2020-09-10 10:42:29
发布2020-09-10 10:42:29
1.5K0
举报
文章被收录于专栏:备份备份

1. JobName

指定有意义JobName, 一般是自己的名字+Job作用。

代码语言:javascript
复制
mapred.job.name="xxx_test"

2. Reduce的个数

说明1

代码语言:javascript
复制
mapred.reduce.tasks

3. Job的task并发数

代码语言:javascript
复制
#  mapper
mapred.job.max.map.running

#  reducer
mapred.job.max.reduce.running

4. 设置Job的失败比例

代码语言:javascript
复制
#  mapper
mapred.max.map.failures.percent

#  reducer
mapred.max.reduce.failures.percent

5. 设置Job的优先级

代码语言:javascript
复制
mapred.job.priority
# LOW、VERY_LOW、NORMAL、HIGH、VERY_HIGH 五种类型

6. 设置task的超时时间

代码语言:javascript
复制
mapred.task.timeout
# (单位:毫秒)

7. 预测执行

代码语言:javascript
复制
mapred.map.tasks.speculative.execution  // 默认打开为true,关闭请显式设置为false
mapred.reduce.tasks.speculative.execution  // 默认打开为true,关闭请显式设置为false
  1. 如果用户不主动设置Reduce个数,系统默认启动一个Reduce。如果用户处理数据量过大(>10G),则会影响Reduce的处理速度。 根据map的输出量合理设置reduce的个数,请确保每个reduce处理的数据不超过10G 通过如下参数指定reduce个数.
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2018/12/13 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. JobName
  • 2. Reduce的个数
  • 3. Job的task并发数
  • 4. 设置Job的失败比例
  • 5. 设置Job的优先级
  • 6. 设置task的超时时间
  • 7. 预测执行
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档