前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >mapReduce中shuffle的四个步骤

mapReduce中shuffle的四个步骤

作者头像
用户4870038
发布2021-02-05 10:17:37
5370
发布2021-02-05 10:17:37
举报
文章被收录于专栏:MyBatis入门案例-注解

文章目录

partition (分区)

分区的算法是 对key进行哈希,取到一个哈希值,用这个哈希值与reduceTask的数量进行取余。余几,这个数据就放在余数编号的partition

sort (排序)

排序的方法有 正序,倒序,字典排序法

combiner (局部聚合)

对数据进行局部聚合。减少网络传入的次数,降低了网络开销。

group (分组)

将相同的key提取出来作为唯一的key,将相同的key对应的value获取出来作为value的list。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2019/11/27 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 文章目录
  • partition (分区)
  • sort (排序)
  • combiner (局部聚合)
  • group (分组)
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档