文章/答案/技术大牛

发布

首页视频110_尚硅谷_Hadoop_MapReduce_ReduceTask工作机制&并行度

110_尚硅谷_Hadoop_MapReduce_ReduceTask工作机制&并行度

2022-12-022022-12-02 16:02:19播放41

点赞0 收藏 0

2.尚硅谷大数据学科--核心框架/尚硅谷大数据技术之Hadoop3.x/视频/110_尚硅谷_Hadoop_MapReduce_ReduceTask工作机制&并行度.mp4

原链接：http://www.atguigu.com/

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:00
好，接下来我们看一下reduce task工作机制啊。这呢也是面试重点，那上来呢，Test呢，一共分为三个阶段啊，有分三个阶段呢，也有分四个阶段的哈，啊主要区别在于这个地方，这个地方呢，你可以叫so阶段，也可以叫me加thought。对吧，归并加排序啊，其实你弄一个排序也行行，那回忆一下这是呢，Map test对吧，把数据准备好，已经持久化到磁盘上了，等待re的拉取。那radio test闪亮登场，他首先干的第一件事儿呢，就是拉取自己指定分区的数据。那这叫什么阶段呢？叫copy阶段。上来先拉，哎，拉的过程。那这样或者是吧，那接下来我对拉取过来的数据进行一个规定排序。那这个是什么阶段呢？叫上阶段。那么拉取过来的文件进行合并。好，那接下来我要往这个reduce方法里面去写，对吧，相同的key进入到reduce方法，那进入到reduce方法里面的内容，那这块呢，其实就是reduce阶段。
01:07
然后呢，最终all put写出到文件那后面这块reduce。比较简单吧，哎，那再总结一下，前面呢是拉取map task数据这个过程拉。是靠的，那拉完之后对一些对拉取过来的数据进行一个排序。那么就是这个排序阶段，那后面呢啊，Reduce处理数据以及输出到文件，这个过程就是reduce阶段。哎，比较清楚，那行，那下面呢，这里面有详细的这个文字描述啊，我就不带家给大家去说了哈，那再往下看radio task，一个并行度决定机制。啥意思呢？回忆一下map task的并行度由谁决定？Map test是不是切片呢？按切片的个数就决定了我未来开启多少个map test。那再思考问题。那欺骗个数由谁决定？
02:00
那谁影响你这个切片呢？那记得那个公式吗？呃，公式呢，是这个，呃，Max啊，然后一，然后mini mini呢是一个叫浪的最大值，还有块大小。对吧，那块大小，那mini呢取块大小，块大小呢，又大于你这个一，那这里面取max。哎，结果呢，是按照默认是按照块大小进行切片，这是一条规则，那同时那这个如果你输入的文件内容对吧，输入的内容比较大，那你就可以控制这个这个公式，进而控制切片的大小啊，也会影响你切片的个数，那同时呢一个呢，还有这个切片规则。因为file input里面啊，有这个，呃，Test file input，还有combine text input，呃，Combine是按文件去读啊，那test呢，是按这个行去读，那读的方式不一样，那最终也会影响你切片的一个个数。那下面我们来看下一个，那reduce task的并行度由谁决定？对吧，那我设置多少个task。
03:02
思考一下。首先呢，我们来看，如果我想设置这个radio test，那很容易啊，我直接用这个方式一设置就行了，那我设置多少个呢？你说那越多越好啊。对吧，那我问你1KB的文件。你咔家设置了100个卖task task，你觉得效率会高吗？那光开启这个radio test的时间都比你处理这个数据的时间长。对吧，哎，得不偿失。啊，也就说像这个宋老师准备工作啊，比他真正干活的时间多长。那不浪费时间吗？对吧？哎，呃，那往下看，那到底设置多少合适呢。一般情况下，在企业里面需要你做实验进行测试，那你说通过这个经验去打磨什么经验，假如说啊，你看这里面有一台节点，一个master，还有16个STEM啊，什么意思啊，16台贝诺节点。那CPU呢是8G啊，内存呢是2G啊，每台服务器2G哈，一台服务器一共2G，有点太少了啊，每台2G，其实深圳在生产环境下一般都是128G这种内存。
04:03
只不过呢，他应该是啊，测试的时候呢，服务器比较少这么去测的那行，那他一共开启了16个map task啊ma test。对吧，Map这个map个数啊，设置为16。然后reduce task呢，它设置多少呢？哎，比如说设置一的时候，它执行的时间这么长，设置五个reduce task的时候，执行时间这么长，十个这个15，这个16~16的时候，它执行时间最短。这20它反而就增加了。对吧，哎，那相当于这是一个正态分布曲线。到达中间这位置达到了它的巅峰，效率最佳，那怎么看这个总时间呢？还记得咱们运行这个任务的时候，有一个8088这个端口吗？那里面是不是运行着application，它的开始这个任务开始的时间和结束时间呢？哎，是能够查看这个执行时间的啊。在这个页面上。OK，那以后你们在生产环境下也是，那这个呢，是逐渐的往上增，哎增加到一定程度之后，你会发现它往下降了，对吧，那这个那就OK，然后再增加时间呢，哎，我再增加这个re test呢，发现这个运行时间反而长了。
05:10
那你就要停止了，哎，达到最佳状态。因为它跟你的服务器环境以及网络的这个状态啊，还有呢，就是你这个任务数据量大小都有关系啊，影响的因素比较多哈。好，那下面呢，看一下这个reduce task的一个注意事项，第一条说reduce text等于零，表示呢，没有reduce觉得输出文件个数和map个数呢是一致的。啥意思，你说你把它设零，咱之前设置过一次吧，哎，设置零那压根就没有理六阶段。哎，直接从这个麦孔往出输出就行了。再来reduce，默认值是一，所以输出文件个数为一个，哎，这是咱们看过吧，哎，默认是一个。好，那再来，如果数据分布不均匀，有可能导致宇宙端数据倾斜，数据倾斜啊是非常这个。
06:00
呃，在企业里面吧，啊，发生问题的概率是最高的一个，那比如说哈，什么叫数据信息。还记得咱们那个手机号吗？136137138139。还有个其他。哎，这么五个文件，那你这五个文件。有可能136的手机号，假如说1亿条。一个手机号1371个1381个1391个其他的一个，我说的是一种极端假设，那会导致什么情况？你136的处理时间会非常非常长，其他任务瞬间结束了。对吧，你这个比如说你像像我干活比较持久，那宋老师呢，那。两秒钟完事。那我这边累的不行，他这边闲的要命对吧？嗯，那这个就叫数据倾斜。那后面呢，我们有详细的这个解决办法对吧？哎，大家思考一下怎么解决。怎么解决？那谁干的活多，那就把它分开呗，对不对，你是136，那我能不能给你这里的数据打散呢？对吧，我在你136加上一些随机数。
07:06
对吧？哎，我让它形成多个reduce，那不就可以了吗。行啊，后面会有详细说。那再来说reduce test的数量啊，并不是任意设置，还要考虑业务的逻辑需求，有些情况需要计算全局数据，那就只能一个reduce test。啥意思？我想对所有的数据进行一个全局的大排序，你告诉我，你能给它分成多个文件吗？说我区内有序，那有意义吗？我要的是全局排序，那没办法，那你就只能设置一个。好，再来说啊，具体多少个radio需要根据集群性能而定。这个地方一定要注意。即使你两台电脑的配置一模一样。我能告诉你，它的计算性能也不一样。对吧，你这个你这个本是苹果本，另一个本是华硕。你觉得他俩这个配置是一样的，那运行出来的效果是一样的吗？
08:00
不一样，所以说这个呢，是必须得经过哎生产环境的一个测试，对吧，哎让它达到一个正态分布最佳的一个状态，然后进行。对吧，嗯，好。再来，如果分区数不是一，但是呢，Reduce是一。那会出现什么情况？是否会执行分区？这前给大家演示过，哎，它不会执行分区过程，因为map task源码中执行分区的前提是先判断你reduce个数是否等于一。对吧，如果大于一，那我再进行跟你这个匹配，如果不大一，他会走那个get part那个方法吗？还记得不，根本就不会，对不对，他用了一个匿名内部类啊，匿名内部类，然后在内部类里面。处理了一下，直接是那个partan减一，然后等于零，这个所有数据都会写到零里面啊，这个呢，呃，一个呃，小细节啊，大家要注意行，那这个呢，就是整个啊，Reduce task工作机制，以及它并行度决定机制相关的一些内容。

展开

我来说两句

0 条评论

登录后参与评论

作者

腾讯云开发者课程

【合辑】尚硅谷大数据技术之Hadoop3.x

（21/178）

8分30秒

01_尚硅谷_Hadoop_开篇_课程整体介绍

670

4分33秒

02_尚硅谷_Hadoop_概论_大数据的概念

610

7分21秒

03_尚硅谷_Hadoop_概论_大数据的特点

460

9分57秒

04_尚硅谷_Hadoop_概论_大数据的应用场景

410

8分16秒

05_尚硅谷_Hadoop_概论_大数据的发展场景

380

6分24秒

06_尚硅谷_Hadoop_概论_未来工作内容

390

7分28秒

07_尚硅谷_Hadoop_入门_课程介绍

450

2分59秒

08_尚硅谷_Hadoop_入门_Hadoop是什么

470

5分50秒

09_尚硅谷_Hadoop_入门_Hadoop发展历史

470

15分24秒

100_尚硅谷_Hadoop_MapReduce_全排序案例

510

3分6秒

101_尚硅谷_Hadoop_MapReduce_二次排序案例

360

6分52秒

102_尚硅谷_Hadoop_MapReduce_区内排序案例

350

7分17秒

103_尚硅谷_Hadoop_MapReduce_Combiner概述

430

12分32秒

104_尚硅谷_Hadoop_MapReduce_Combiner案例

490

3分41秒

105_尚硅谷_Hadoop_MapReduce_outputformat概述

330

4分21秒

106_尚硅谷_Hadoop_MapReduce_自定义outputformat案例需求分析

310

4分32秒

107_尚硅谷_Hadoop_MapReduce_自定义outputformat案例mapper&reducer

390

12分31秒

108_尚硅谷_Hadoop_MapReduce_自定义outputformat案例执行

470

3分45秒

109_尚硅谷_Hadoop_MapReduce_MapTask工作机制

330

5分57秒

10_尚硅谷_Hadoop_入门_Hadoop三大发行版本

420

8分59秒

110_尚硅谷_Hadoop_MapReduce_ReduceTask工作机制&并行度

410

16分56秒

111_尚硅谷_Hadoop_MapReduce_MapTask源码

460

15分23秒

112_尚硅谷_Hadoop_MapReduce_ReduceTask源码

450

9分21秒

113_尚硅谷_Hadoop_MapReduce_ReduceJoin案例需求分析

390

7分7秒

114_尚硅谷_Hadoop_MapReduce_ReduceJoin案例TableBean

450

12分33秒

115_尚硅谷_Hadoop_MapReduce_ReduceJoin案例Mapper

370

12分26秒

116_尚硅谷_Hadoop_MapReduce_ReduceJoin案例完成

530

4分14秒

117_尚硅谷_Hadoop_MapReduce_ReduceJoin案例debug

380

6分56秒

118_尚硅谷_Hadoop_MapReduce_MapJoin案例需求分析

490

13分9秒

119_尚硅谷_Hadoop_MapReduce_MapJoin案例完成

400

3分51秒

11_尚硅谷_Hadoop_入门_Hadoop优势

400

2分48秒

120_尚硅谷_Hadoop_MapReduce_MapJoin案例debug

400

15分10秒

121_尚硅谷_Hadoop_MapReduce_ETL数据清洗案例

450

10分49秒

122_尚硅谷_Hadoop_MapReduce_MapReduce开发总结

380

16分4秒

123_尚硅谷_Hadoop_MapReduce_压缩概述

300

10分21秒

124_尚硅谷_Hadoop_MapReduce_压缩案例实操

330

5分18秒

125_尚硅谷_Hadoop_Yarn_课程介绍

400

4分55秒

126_尚硅谷_Hadoop_Yarn_基础架构

440

6分42秒

127_尚硅谷_Hadoop_Yarn_工作机制

400

3分35秒

128_尚硅谷_Hadoop_Yarn_全流程作业

340

4分17秒

129_尚硅谷_Hadoop_Yarn_FIFO调度器

380

2分59秒

12_尚硅谷_Hadoop_入门_Hadoop1.x2.x3.x区别

440

10分23秒

130_尚硅谷_Hadoop_Yarn_容量调度器

370

19分24秒

131_尚硅谷_Hadoop_Yarn_公平调度器

480

14分48秒

132_尚硅谷_Hadoop_Yarn_常用命令

500

10分25秒

133_尚硅谷_Hadoop_Yarn_生产环境核心参数配置

350

4分14秒

134_尚硅谷_Hadoop_Yarn_Linux集群快照

380

15分30秒

135_尚硅谷_Hadoop_Yarn_生产环境核心参数配置案例

330

5分42秒

136_尚硅谷_Hadoop_Yarn_生产环境多队列创建&好处

360

12分39秒

137_尚硅谷_Hadoop_Yarn_容量调度器多队列案例

370

6分50秒

138_尚硅谷_Hadoop_Yarn_容量调度器任务优先级

350

15分5秒

139_尚硅谷_Hadoop_Yarn_公平调度器案例

360

6分24秒

13_尚硅谷_Hadoop_入门_HDFS概述

470

5分11秒

140_尚硅谷_Hadoop_Yarn_Tool接口案例环境准备

370

19分14秒

141_尚硅谷_Hadoop_Yarn_Tool接口案例完成

430

10分25秒

142_尚硅谷_Hadoop_Yarn_课程总结

420

14分13秒

143_尚硅谷_Hadoop_生产调优手册_核心参数_NN内存配置

240

3分11秒

144_尚硅谷_Hadoop_生产调优手册_核心参数_NN心跳并发配置

330

7分15秒

145_尚硅谷_Hadoop_生产调优手册_核心参数_开启回收站

370

5分54秒

146_尚硅谷_Hadoop_生产调优手册_HDFS压测环境准备

390

18分53秒

147_尚硅谷_Hadoop_生产调优手册_HDFS读写压测

400

8分24秒

148_尚硅谷_Hadoop_生产调优手册_NN多目录配置

280

8分41秒

149_尚硅谷_Hadoop_生产调优手册_DN多目录及磁盘间数据均衡

350

6分34秒

14_尚硅谷_Hadoop_入门_YARN概述

400

10分0秒

150_尚硅谷_Hadoop_生产调优手册_添加白名单

350

13分6秒

151_尚硅谷_Hadoop_生产调优手册_服役新服务器

370

3分16秒

152_尚硅谷_Hadoop_生产调优手册_服务器间数据均衡

340

7分45秒

153_尚硅谷_Hadoop_生产调优手册_黑名单退役服务器

330

11分20秒

154_尚硅谷_Hadoop_生产调优手册_存储优化_5台服务器准备

390

8分15秒

155_尚硅谷_Hadoop_生产调优手册_存储优化_纠删码原理

320

10分40秒

156_尚硅谷_Hadoop_生产调优手册_存储优化_纠删码案例

390

8分34秒

157_尚硅谷_Hadoop_生产调优手册_存储优化_异构存储概述

430

17分39秒

158_尚硅谷_Hadoop_生产调优手册_存储优化_异构存储案例实操

380

9分8秒

159_尚硅谷_Hadoop_生产调优手册_NameNode故障处理

430

1分54秒

15_尚硅谷_Hadoop_入门_MapReduce概述

500

18分31秒

160_尚硅谷_Hadoop_生产调优手册_集群安全模式&磁盘修复

360

9分18秒

161_尚硅谷_Hadoop_生产调优手册_慢磁盘监控

420

8分10秒

162_尚硅谷_Hadoop_生产调优手册_小文件归档

410

3分17秒

163_尚硅谷_Hadoop_生产调优手册_集群数据迁移

340

2分42秒

164_尚硅谷_Hadoop_生产调优手册_MR跑的慢的原因

370

12分25秒

165_尚硅谷_Hadoop_生产调优手册_MR常用调优参数

390

5分25秒

166_尚硅谷_Hadoop_生产调优手册_MR数据倾斜问题

410

1分17秒

167_尚硅谷_Hadoop_生产调优手册_Yarn生产经验

370

10分13秒

168_尚硅谷_Hadoop_生产调优手册_HDFS小文件优化方法

340

2分52秒

169_尚硅谷_Hadoop_生产调优手册_MapReduce集群压测

350

3分21秒

16_尚硅谷_Hadoop_入门_HDFS&YARN&MR关系

420

14分59秒

170_尚硅谷_Hadoop_生产调优手册_企业开发场景案例

390

13分43秒

171_尚硅谷_Hadoop_源码解析_RPC通信原理解析

320

21分36秒

172_尚硅谷_Hadoop_源码解析_NameNode启动源码解析

400

22分9秒

173_尚硅谷_Hadoop_源码解析_DataNode启动源码解析

400

7分38秒

174_尚硅谷_Hadoop_源码解析_HDFS上传源码_整体介绍

370

10分12秒

175_尚硅谷_Hadoop_源码解析_HDFS上传源码_create

380

23分1秒

176_尚硅谷_Hadoop_源码解析_HDFS上传源码_write

400

21分20秒

177_尚硅谷_Hadoop_源码解析_Yarn源码解析

370

21分1秒

178_尚硅谷_Hadoop_源码解析_Hadoop源码编译

400

9分16秒

17_尚硅谷_Hadoop_入门_大数据技术生态体系

540

4分40秒

18_尚硅谷_Hadoop_入门_VMware安装

600

15分55秒

19_尚硅谷_Hadoop_入门_Centos7.5软硬件安装

520

10分49秒

20_尚硅谷_Hadoop_入门_IP和主机名称配置

540

100

9分4秒

21_尚硅谷_Hadoop_入门_Xshell远程访问工具

630

101

12分24秒

22_尚硅谷_Hadoop_入门_模板虚拟机准备完成

550

102

15分0秒

23_尚硅谷_Hadoop_入门_克隆三台虚拟机

480

103

7分0秒

24_尚硅谷_Hadoop_入门_JDK安装

460

104

7分19秒

25_尚硅谷_Hadoop_入门_Hadoop安装

560

105

11分55秒

26_尚硅谷_Hadoop_入门_本地运行模式

480

106

15分0秒

27_尚硅谷_Hadoop_入门_scp&rsync命令讲解

550

107

18分13秒

28_尚硅谷_Hadoop_入门_xsync分发脚本

460

108

11分24秒

29_尚硅谷_Hadoop_入门_ssh免密登录

410

109

13分22秒

30_尚硅谷_Hadoop_入门_集群配置

590

110

16分51秒

31_尚硅谷_Hadoop_入门_群起集群并测试

420

111

8分9秒

32_尚硅谷_Hadoop_入门_集群崩溃处理办法

410

112

5分24秒

33_尚硅谷_Hadoop_入门_历史服务器配置

410

113

5分41秒

34_尚硅谷_Hadoop_入门_日志聚集功能配置

430

114

9分17秒

35_尚硅谷_Hadoop_入门_两个常用脚本

430

115

4分14秒

36_尚硅谷_Hadoop_入门_两道面试题

520

116

11分26秒

37_尚硅谷_Hadoop_入门_集群时间同步

500

117

10分56秒

38_尚硅谷_Hadoop_入门_常见问题总结

460

118

4分22秒

39_尚硅谷_Hadoop_HDFS_课程介绍

400

119

4分10秒

40_尚硅谷_Hadoop_HDFS_产生背景和定义

480

120

5分26秒

41_尚硅谷_Hadoop_HDFS_优缺点

440

121

9分8秒

42_尚硅谷_Hadoop_HDFS_组成

530

122

8分0秒

43_尚硅谷_Hadoop_HDFS_文件块大小

410

123

9分47秒

44_尚硅谷_Hadoop_HDFS_Shell命令上传

440

124

16分40秒

45_尚硅谷_Hadoop_HDFS_Shell命令下载&直接操作

430

125

8分18秒

46_尚硅谷_Hadoop_HDFS_API环境准备

560

126

10分52秒

47_尚硅谷_Hadoop_HDFS_API创建文件夹

530

127

6分41秒

48_尚硅谷_Hadoop_HDFS_API上传

440

128

5分6秒

49_尚硅谷_Hadoop_HDFS_API参数的优先级

310

129

8分23秒

50_尚硅谷_Hadoop_HDFS_API文件下载

430

130

4分11秒

51_尚硅谷_Hadoop_HDFS_API文件删除

430

131

5分2秒

52_尚硅谷_Hadoop_HDFS_API文件更名和移动

400

132

7分56秒

53_尚硅谷_Hadoop_HDFS_API文件详情查看

390

133

3分19秒

54_尚硅谷_Hadoop_HDFS_API文件和文件夹判断

440

134

11分36秒

55_尚硅谷_Hadoop_HDFS_写数据流程

510

135

4分29秒

56_尚硅谷_Hadoop_HDFS_节点距离计算

450

136

6分6秒

57_尚硅谷_Hadoop_HDFS_机架感知（副本存储节点选择）

330

137

5分3秒

58_尚硅谷_Hadoop_HDFS_读数据流程

370

138

13分27秒

59_尚硅谷_Hadoop_HDFS_NN和2NN工作机制

390

139

9分32秒

60_尚硅谷_Hadoop_HDFS_FsImage镜像文件

390

140

4分48秒

61_尚硅谷_Hadoop_HDFS_Edits编辑日志

350

141

2分33秒

62_尚硅谷_Hadoop_HDFS_检查点时间设置

410

142

7分35秒

63_尚硅谷_Hadoop_HDFS_DN工作机制

390

143

7分6秒

64_尚硅谷_Hadoop_HDFS_数据完整性

420

144

4分43秒

65_尚硅谷_Hadoop_HDFS_掉线时限参数设置

470

145

3分43秒

66_尚硅谷_Hadoop_HDFS_总结

380

146

4分22秒

67_尚硅谷_Hadoop_MapReduce_课程介绍

360

147

9分58秒

68_尚硅谷_Hadoop_MapReduce_概述&优点缺点

420

148

9分41秒

69_尚硅谷_Hadoop_MapReduce_核心思想

350

149

7分6秒

70_尚硅谷_Hadoop_MapReduce_官方WC源码&序列化类型

380

150

7分7秒

71_尚硅谷_Hadoop_MapReduce_编程规范

400

151

6分55秒

72_尚硅谷_Hadoop_MapReduce_WordCount案例需求分析

420

152

4分9秒

73_尚硅谷_Hadoop_MapReduce_WordCount案例环境准备

360

153

14分13秒

74_尚硅谷_Hadoop_MapReduce_WordCount案例Mapper

360

154

8分45秒

75_尚硅谷_Hadoop_MapReduce_WordCount案例Reducer

430

155

10分58秒

76_尚硅谷_Hadoop_MapReduce_WordCount案例Driver

470

156

15分20秒

77_尚硅谷_Hadoop_MapReduce_WordCount案例Debug调试

370

157

12分41秒

78_尚硅谷_Hadoop_MapReduce_WordCount案例集群运行

500

158

6分29秒

79_尚硅谷_Hadoop_MapReduce_序列化概述

380

159

8分18秒

80_尚硅谷_Hadoop_MapReduce_自定义序列化步骤

450

160

9分8秒

81_尚硅谷_Hadoop_MapReduce_序列化案例需求分析

410

161

6分50秒

82_尚硅谷_Hadoop_MapReduce_序列化案例FlowBean

420

162

8分59秒

83_尚硅谷_Hadoop_MapReduce_序列化案例FlowMapper

420

163

4分49秒

84_尚硅谷_Hadoop_MapReduce_序列化案例FlowReducer

450

164

6分20秒

85_尚硅谷_Hadoop_MapReduce_序列化案例FlowDriver

400

165

7分53秒

86_尚硅谷_Hadoop_MapReduce_序列化案例debug调试

350

166

15分18秒

87_尚硅谷_Hadoop_MapReduce_切片机制与MapTask并行度决定机制

360

167

20分33秒

88_尚硅谷_Hadoop_MapReduce_Job提交流程

320

168

19分16秒

89_尚硅谷_Hadoop_MapReduce_切片源码

380

169

4分59秒

90_尚硅谷_Hadoop_MapReduce_切片源码总结

530

170

3分13秒

91_尚硅谷_Hadoop_MapReduce_FileInputFormat切片机制

370

171

4分38秒

92_尚硅谷_Hadoop_MapReduce_TextInputFormat

430

172

10分17秒

93_尚硅谷_Hadoop_MapReduce_CombineTextInputFormat

320

173

16分42秒

94_尚硅谷_Hadoop_MapReduce_MapReduce工作流程

450

174

6分21秒

95_尚硅谷_Hadoop_MapReduce_Shuffle机制

390

175

12分49秒

96_尚硅谷_Hadoop_MapReduce_默认HashPartitioner分区

450

176

7分19秒

97_尚硅谷_Hadoop_MapReduce_自定义分区案例

370

177

7分19秒

98_尚硅谷_Hadoop_MapReduce_分区数与Reduce个数的总结

360

178

14分13秒

99_尚硅谷_Hadoop_MapReduce_排序概述

400

110_尚硅谷_Hadoop_MapReduce_ReduceTask工作机制&并行度

我来说两句

作者

相关推荐

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐