文章/答案/技术大牛

发布

首页视频69_尚硅谷_Hadoop_MapReduce_核心思想

69_尚硅谷_Hadoop_MapReduce_核心思想

2022-12-022022-12-02 16:02:19播放35

点赞0 收藏 0

2.尚硅谷大数据学科--核心框架/尚硅谷大数据技术之Hadoop3.x/视频/69_尚硅谷_Hadoop_MapReduce_核心思想.mp4

原链接：http://www.atguigu.com/

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:00
好，接下来呢，给大家介绍一下maps核心思想啊，首先来看一下图啊。呃，这里有个需求，说统计其中每一个单词出现的总次数啊，一说统计单词的总次数，What，看时又来了，哎，说查询结果呀，是A到P一个文件，Q到J一个文件。那假如说下面呢，这就是我们要统计的数据源。你可以把它理解为一本书啊，一本英文书对吧，这里面有大部分的这个单词，那如果现在我让你人工的去统计，你怎么统计。我建议你统计这本书当中，哎，A到B。单词啊，首字母是A到P的，放到一个文件里面，各到这再放一个文件。那通常你的做法是这样的吗？首先这是你那一个是A到P，一个文一个文件，那A到PQ到J，比如说我会准备两张纸，一张纸呢是A到P。另一张纸呢，是Q到Z。然后接下来你会怎么办？我会去读一下啊，一行一行读吧，对吧，我读第一行阿姨发现hi doop，那放到哪里，诶放到A到P。
01:08
好，那我再读呢，说Spark，哎，Spark have啊，遇到Spark have你怎么办，这是一行啊，那我说中间用这个空格给它切开，切开之后哦，一看S放到这个里面，然后have呢，放到上一面里面去，但你发现我要统计一本书，你一个人去这么统计。那是不是感觉慢呢，那这是什么？哎，那这时候比如说我把这个。哎，来一个。我再叫一个人，我把宋老师叫过来，对吧？我把宋老师叫过来，那宋老师呢，他也会像我一样准备两张纸。一个呢是A到P，另一个呢是Q到G。哎，看到这里。是这样吗？哎，看到谁。那你这两个人发现好像还是很慢。是吧？哎，那宋老师就想个招啊，说这个男女干活，这个男女干，男女搭配干活不累是吧？哎，他又把苍老师叫过来了。
02:04
也让常老师再准备A到PQ到Z1张纸。这样去计算。啊，而且呢，分工比较明确，比如说啊这个第一个200兆，哎200兆这个内容呢，哎，我俩怎么分呢，我处理其中的128兆。这128兆给我，我来处理。那下面剩下72兆给谁呢？给宋老师。哎，孙老师呢，让这个苍老师把这100兆的数据进行一个处理，那大家呢，这个任务量啊，整体上来说都不是特别大。那欣然接受了是吧？来正常去统计，那统计完之后，因为我要的是整本书当中所有单词统计的次数，也就说A到B放一个文件，可以到这放一个文件里面。那这是什么？我们仨人这么统计完之后，那正常情况下，我们还需要把这三个结果累加在一起吧，好，那这时候呢，我们又把波波老师叫过来了。
03:00
哎，波波老师，波波老师呢，负责帮我们统计，他怎么统计啊？哎，他只负责统计A到P的，把我的A到P拿过去，把宋老师的A到P，把苍老师的A到P拿过去。把这个一累加就OK了。对吧，那这个时候。那好，还有Q到J呢，哎，Q到J呢，我们再把严格再叫过来，那严格呢，把Q到JQ到JQ到J计算完，那最后呢，就会统计，比如说还多。多少呢？哎，出现14，假如说啊，然后呢，这个还有一个Java。对吧，出现100次。这样就实现了一个单词统计的一个效果。啊，人手越多对吧，相对来说速度就快一些啊，其实这思想我们就讲完了。那下面我们来看一下细节，那说代码是如何来实现这个过程的呢？OK，首先map运算呢，一般分为两个阶段，一个叫map阶段，一个叫reduce阶段，那刚才已经看到了，哎，我盛老师苍老师是属于每个人分别干活对吧？哎，处理其中一部分，然后把它分好区。
04:07
一块一块一块一块一块，分完之后，由杨哥和波波老师进行一个统计，那统计的阶段就是reduce，分的过程就是map阶段。往下找。那首先呢，哎，我这边呢，处理128兆，那这个呢，处理72兆，下一个呢处理的是100兆，那为什么这样分呢？哎，你看这个128兆这个这个数字。有敏感度吗？对吧，我们再分讲HGFS的时候，是不是块大小就是128兆啊。啊，一块是128兆，那么我一个每一个map test默认处理128兆数据，那后面再给大家说，为什么是128啊，他能不能改呢？哎，可以，那什么情况下改大，什么情况改小啊后面我们会详细给大家说，行，那这是map t对吧？哎，我干我的活，宋老师他读他那自己的72兆，那这个常老师呢，读他的，哎自己呢，100兆。
05:06
这样就相当于把这本书啊分成了三份，对不对，哎，三份互不相干。那这边说了map阶段呢，是并发运行，互不相干，就说我只处理这本书的前100页啊，就是前128兆，那中间这72道由宋老师来处理，那最后的尾页的100页，哎，由苍老师来处理。OK，再往下走，那他我我是怎么处理的呢？首先我是按行去读数据，一行一行的来读，对吧？哎，避免这个丢丢行好，那下面读到一行，你像这个第二行里面Spark和have，那它是两个单词。我需要把这个单词进行一个切分。I切分出来。再来，那我未来肯定要计数啊。我说这个单词出现多少次？
06:00
那么我在这个map阶段，我只负责取出一个单词，我就在后面标一。来取出一个单词标一，那即使是比如说我这出现一个Spark，再出现一个Spark，那我怎么记我仍然是SPARK1，然后SPARK1这种形式的格式的数据发给谁呀？哎，发给波波老师。让它进行后续累加，它呢，一看哦，这个Spark这个K是相同的，它会把这个末尾这个一一加在一起，那它最终出现的就是SPARK2。哎，这样一个结果。那再来。那我需要统计这个A到P和Q到Z，我是不是得准备两张纸啊，哎，两张纸，一张纸呢，是用来存储A到P，另一张纸存储Q到Z。那对应的代码里面就是分区一和分区二两个分区，哎，分别存储不同的那这个首字母开头的单词。那当然了，这个宋老师和这个苍老师他们也是同样的方式准备两张纸，纸里面存储的对应的这个单词。
07:06
啊，我们的活儿干完之后，那接下来波波老师和杨哥闪亮登场。啊，一个呢，负责A到B的，一个是负责听到这个。好，那reduce阶段呢，是并发reduce task啊，完全互不相干，也就说啊，这个波波老师和杨哥他们两个在统计单词的时候，也是相互没有进行交通交流，不需要啊，因为我只从这拿数据就行了，对吧，我拿我的，我拿我的，我拿的只是A到P跟你之间没有任何交集。嗯，好。这样，哎，波老师把这个他的拿过去了。那杨哥呢，把他自己的推到这的拿走，拿走之后他们最终会给我们出一个报告，哪一个单词出现了多少次，以文件的形式输出出来。好，一人出一个报告就OK了。那map编程呢？只包含其中一个map阶段和一个reduce阶段，比如说它只有一个map阶段和reduce阶段。
08:05
那如果用户呢，想实现这种比较复杂的逻辑，比如说这个任务介绍完之后。计算下一个任务，再下一个任务啊，比较逻辑，这个比较复杂的，那怎么办呢？记住那你只能有多个卖手流程序，第一个一个一个一个一个这样去做，而且呢，之前咱还分析过说map不是不能这么做，但是呢，他不擅长这么做，因为它的效率很低，每次的中间计算结果它都要持久化到磁盘。磁盘的读写效率啊都比较低，那我们后面有这个Spark，它这个中间结果呢，是可以在内存当中进行处理的，那这个效率就会高很多啊好。那行，那这个是外边的核心思想，那看起来很简单，但是呢，其实这里面还有很多细节啊，我们需要后续进行一个讨论，比如说第一个map task是如何工作的，比如说这里面它到底是如何用代码来实现的。我们后续需要解决，还有呢，Reduce task又是如何工作的？它怎么合的？
09:06
Map t如何控制这个分区，比如说我具体怎么来的这两个分区，那其实在底层呢，还有排序。那它怎么排的？再来map task和reduce task之间，他们又是怎么工作的？比如说他们两个怎么工作，比如说map task什么时候结束，结束之后radio task为什么知道？对吧，哎，那这个呢，就是map的一个核心思想啊，你就可以把它分为这是一本书，对吧，让你去统计，你怎么统计。那你自己统计太慢，那你就叫各种帮手啊，来帮你去完成啊。

展开

我来说两句

0 条评论

登录后参与评论

作者

腾讯云开发者课程

【合辑】尚硅谷大数据技术之Hadoop3.x

（148/178）

8分30秒

01_尚硅谷_Hadoop_开篇_课程整体介绍

670

4分33秒

02_尚硅谷_Hadoop_概论_大数据的概念

610

7分21秒

03_尚硅谷_Hadoop_概论_大数据的特点

460

9分57秒

04_尚硅谷_Hadoop_概论_大数据的应用场景

410

8分16秒

05_尚硅谷_Hadoop_概论_大数据的发展场景

380

6分24秒

06_尚硅谷_Hadoop_概论_未来工作内容

390

7分28秒

07_尚硅谷_Hadoop_入门_课程介绍

450

2分59秒

08_尚硅谷_Hadoop_入门_Hadoop是什么

470

5分50秒

09_尚硅谷_Hadoop_入门_Hadoop发展历史

470

15分24秒

100_尚硅谷_Hadoop_MapReduce_全排序案例

510

3分6秒

101_尚硅谷_Hadoop_MapReduce_二次排序案例

360

6分52秒

102_尚硅谷_Hadoop_MapReduce_区内排序案例

350

7分17秒

103_尚硅谷_Hadoop_MapReduce_Combiner概述

430

12分32秒

104_尚硅谷_Hadoop_MapReduce_Combiner案例

490

3分41秒

105_尚硅谷_Hadoop_MapReduce_outputformat概述

330

4分21秒

106_尚硅谷_Hadoop_MapReduce_自定义outputformat案例需求分析

310

4分32秒

107_尚硅谷_Hadoop_MapReduce_自定义outputformat案例mapper&reducer

390

12分31秒

108_尚硅谷_Hadoop_MapReduce_自定义outputformat案例执行

470

3分45秒

109_尚硅谷_Hadoop_MapReduce_MapTask工作机制

330

5分57秒

10_尚硅谷_Hadoop_入门_Hadoop三大发行版本

420

8分59秒

110_尚硅谷_Hadoop_MapReduce_ReduceTask工作机制&并行度

410

16分56秒

111_尚硅谷_Hadoop_MapReduce_MapTask源码

460

15分23秒

112_尚硅谷_Hadoop_MapReduce_ReduceTask源码

450

9分21秒

113_尚硅谷_Hadoop_MapReduce_ReduceJoin案例需求分析

390

7分7秒

114_尚硅谷_Hadoop_MapReduce_ReduceJoin案例TableBean

450

12分33秒

115_尚硅谷_Hadoop_MapReduce_ReduceJoin案例Mapper

370

12分26秒

116_尚硅谷_Hadoop_MapReduce_ReduceJoin案例完成

530

4分14秒

117_尚硅谷_Hadoop_MapReduce_ReduceJoin案例debug

380

6分56秒

118_尚硅谷_Hadoop_MapReduce_MapJoin案例需求分析

490

13分9秒

119_尚硅谷_Hadoop_MapReduce_MapJoin案例完成

400

3分51秒

11_尚硅谷_Hadoop_入门_Hadoop优势

400

2分48秒

120_尚硅谷_Hadoop_MapReduce_MapJoin案例debug

400

15分10秒

121_尚硅谷_Hadoop_MapReduce_ETL数据清洗案例

450

10分49秒

122_尚硅谷_Hadoop_MapReduce_MapReduce开发总结

380

16分4秒

123_尚硅谷_Hadoop_MapReduce_压缩概述

300

10分21秒

124_尚硅谷_Hadoop_MapReduce_压缩案例实操

330

5分18秒

125_尚硅谷_Hadoop_Yarn_课程介绍

400

4分55秒

126_尚硅谷_Hadoop_Yarn_基础架构

440

6分42秒

127_尚硅谷_Hadoop_Yarn_工作机制

400

3分35秒

128_尚硅谷_Hadoop_Yarn_全流程作业

340

4分17秒

129_尚硅谷_Hadoop_Yarn_FIFO调度器

380

2分59秒

12_尚硅谷_Hadoop_入门_Hadoop1.x2.x3.x区别

440

10分23秒

130_尚硅谷_Hadoop_Yarn_容量调度器

370

19分24秒

131_尚硅谷_Hadoop_Yarn_公平调度器

480

14分48秒

132_尚硅谷_Hadoop_Yarn_常用命令

500

10分25秒

133_尚硅谷_Hadoop_Yarn_生产环境核心参数配置

350

4分14秒

134_尚硅谷_Hadoop_Yarn_Linux集群快照

380

15分30秒

135_尚硅谷_Hadoop_Yarn_生产环境核心参数配置案例

330

5分42秒

136_尚硅谷_Hadoop_Yarn_生产环境多队列创建&好处

360

12分39秒

137_尚硅谷_Hadoop_Yarn_容量调度器多队列案例

370

6分50秒

138_尚硅谷_Hadoop_Yarn_容量调度器任务优先级

350

15分5秒

139_尚硅谷_Hadoop_Yarn_公平调度器案例

360

6分24秒

13_尚硅谷_Hadoop_入门_HDFS概述

470

5分11秒

140_尚硅谷_Hadoop_Yarn_Tool接口案例环境准备

370

19分14秒

141_尚硅谷_Hadoop_Yarn_Tool接口案例完成

430

10分25秒

142_尚硅谷_Hadoop_Yarn_课程总结

420

14分13秒

143_尚硅谷_Hadoop_生产调优手册_核心参数_NN内存配置

240

3分11秒

144_尚硅谷_Hadoop_生产调优手册_核心参数_NN心跳并发配置

330

7分15秒

145_尚硅谷_Hadoop_生产调优手册_核心参数_开启回收站

370

5分54秒

146_尚硅谷_Hadoop_生产调优手册_HDFS压测环境准备

390

18分53秒

147_尚硅谷_Hadoop_生产调优手册_HDFS读写压测

400

8分24秒

148_尚硅谷_Hadoop_生产调优手册_NN多目录配置

280

8分41秒

149_尚硅谷_Hadoop_生产调优手册_DN多目录及磁盘间数据均衡

350

6分34秒

14_尚硅谷_Hadoop_入门_YARN概述

400

10分0秒

150_尚硅谷_Hadoop_生产调优手册_添加白名单

350

13分6秒

151_尚硅谷_Hadoop_生产调优手册_服役新服务器

370

3分16秒

152_尚硅谷_Hadoop_生产调优手册_服务器间数据均衡

340

7分45秒

153_尚硅谷_Hadoop_生产调优手册_黑名单退役服务器

330

11分20秒

154_尚硅谷_Hadoop_生产调优手册_存储优化_5台服务器准备

390

8分15秒

155_尚硅谷_Hadoop_生产调优手册_存储优化_纠删码原理

320

10分40秒

156_尚硅谷_Hadoop_生产调优手册_存储优化_纠删码案例

390

8分34秒

157_尚硅谷_Hadoop_生产调优手册_存储优化_异构存储概述

430

17分39秒

158_尚硅谷_Hadoop_生产调优手册_存储优化_异构存储案例实操

380

9分8秒

159_尚硅谷_Hadoop_生产调优手册_NameNode故障处理

430

1分54秒

15_尚硅谷_Hadoop_入门_MapReduce概述

500

18分31秒

160_尚硅谷_Hadoop_生产调优手册_集群安全模式&磁盘修复

360

9分18秒

161_尚硅谷_Hadoop_生产调优手册_慢磁盘监控

420

8分10秒

162_尚硅谷_Hadoop_生产调优手册_小文件归档

410

3分17秒

163_尚硅谷_Hadoop_生产调优手册_集群数据迁移

340

2分42秒

164_尚硅谷_Hadoop_生产调优手册_MR跑的慢的原因

370

12分25秒

165_尚硅谷_Hadoop_生产调优手册_MR常用调优参数

390

5分25秒

166_尚硅谷_Hadoop_生产调优手册_MR数据倾斜问题

410

1分17秒

167_尚硅谷_Hadoop_生产调优手册_Yarn生产经验

370

10分13秒

168_尚硅谷_Hadoop_生产调优手册_HDFS小文件优化方法

340

2分52秒

169_尚硅谷_Hadoop_生产调优手册_MapReduce集群压测

350

3分21秒

16_尚硅谷_Hadoop_入门_HDFS&YARN&MR关系

420

14分59秒

170_尚硅谷_Hadoop_生产调优手册_企业开发场景案例

390

13分43秒

171_尚硅谷_Hadoop_源码解析_RPC通信原理解析

320

21分36秒

172_尚硅谷_Hadoop_源码解析_NameNode启动源码解析

400

22分9秒

173_尚硅谷_Hadoop_源码解析_DataNode启动源码解析

400

7分38秒

174_尚硅谷_Hadoop_源码解析_HDFS上传源码_整体介绍

370

10分12秒

175_尚硅谷_Hadoop_源码解析_HDFS上传源码_create

380

23分1秒

176_尚硅谷_Hadoop_源码解析_HDFS上传源码_write

400

21分20秒

177_尚硅谷_Hadoop_源码解析_Yarn源码解析

370

21分1秒

178_尚硅谷_Hadoop_源码解析_Hadoop源码编译

400

9分16秒

17_尚硅谷_Hadoop_入门_大数据技术生态体系

540

4分40秒

18_尚硅谷_Hadoop_入门_VMware安装

600

15分55秒

19_尚硅谷_Hadoop_入门_Centos7.5软硬件安装

520

10分49秒

20_尚硅谷_Hadoop_入门_IP和主机名称配置

540

100

9分4秒

21_尚硅谷_Hadoop_入门_Xshell远程访问工具

630

101

12分24秒

22_尚硅谷_Hadoop_入门_模板虚拟机准备完成

550

102

15分0秒

23_尚硅谷_Hadoop_入门_克隆三台虚拟机

480

103

7分0秒

24_尚硅谷_Hadoop_入门_JDK安装

460

104

7分19秒

25_尚硅谷_Hadoop_入门_Hadoop安装

560

105

11分55秒

26_尚硅谷_Hadoop_入门_本地运行模式

480

106

15分0秒

27_尚硅谷_Hadoop_入门_scp&rsync命令讲解

550

107

18分13秒

28_尚硅谷_Hadoop_入门_xsync分发脚本

460

108

11分24秒

29_尚硅谷_Hadoop_入门_ssh免密登录

410

109

13分22秒

30_尚硅谷_Hadoop_入门_集群配置

590

110

16分51秒

31_尚硅谷_Hadoop_入门_群起集群并测试

420

111

8分9秒

32_尚硅谷_Hadoop_入门_集群崩溃处理办法

410

112

5分24秒

33_尚硅谷_Hadoop_入门_历史服务器配置

410

113

5分41秒

34_尚硅谷_Hadoop_入门_日志聚集功能配置

430

114

9分17秒

35_尚硅谷_Hadoop_入门_两个常用脚本

430

115

4分14秒

36_尚硅谷_Hadoop_入门_两道面试题

520

116

11分26秒

37_尚硅谷_Hadoop_入门_集群时间同步

500

117

10分56秒

38_尚硅谷_Hadoop_入门_常见问题总结

460

118

4分22秒

39_尚硅谷_Hadoop_HDFS_课程介绍

400

119

4分10秒

40_尚硅谷_Hadoop_HDFS_产生背景和定义

480

120

5分26秒

41_尚硅谷_Hadoop_HDFS_优缺点

440

121

9分8秒

42_尚硅谷_Hadoop_HDFS_组成

530

122

8分0秒

43_尚硅谷_Hadoop_HDFS_文件块大小

410

123

9分47秒

44_尚硅谷_Hadoop_HDFS_Shell命令上传

440

124

16分40秒

45_尚硅谷_Hadoop_HDFS_Shell命令下载&直接操作

430

125

8分18秒

46_尚硅谷_Hadoop_HDFS_API环境准备

560

126

10分52秒

47_尚硅谷_Hadoop_HDFS_API创建文件夹

530

127

6分41秒

48_尚硅谷_Hadoop_HDFS_API上传

440

128

5分6秒

49_尚硅谷_Hadoop_HDFS_API参数的优先级

310

129

8分23秒

50_尚硅谷_Hadoop_HDFS_API文件下载

430

130

4分11秒

51_尚硅谷_Hadoop_HDFS_API文件删除

430

131

5分2秒

52_尚硅谷_Hadoop_HDFS_API文件更名和移动

400

132

7分56秒

53_尚硅谷_Hadoop_HDFS_API文件详情查看

390

133

3分19秒

54_尚硅谷_Hadoop_HDFS_API文件和文件夹判断

440

134

11分36秒

55_尚硅谷_Hadoop_HDFS_写数据流程

510

135

4分29秒

56_尚硅谷_Hadoop_HDFS_节点距离计算

450

136

6分6秒

57_尚硅谷_Hadoop_HDFS_机架感知（副本存储节点选择）

330

137

5分3秒

58_尚硅谷_Hadoop_HDFS_读数据流程

370

138

13分27秒

59_尚硅谷_Hadoop_HDFS_NN和2NN工作机制

390

139

9分32秒

60_尚硅谷_Hadoop_HDFS_FsImage镜像文件

390

140

4分48秒

61_尚硅谷_Hadoop_HDFS_Edits编辑日志

350

141

2分33秒

62_尚硅谷_Hadoop_HDFS_检查点时间设置

410

142

7分35秒

63_尚硅谷_Hadoop_HDFS_DN工作机制

390

143

7分6秒

64_尚硅谷_Hadoop_HDFS_数据完整性

420

144

4分43秒

65_尚硅谷_Hadoop_HDFS_掉线时限参数设置

470

145

3分43秒

66_尚硅谷_Hadoop_HDFS_总结

380

146

4分22秒

67_尚硅谷_Hadoop_MapReduce_课程介绍

360

147

9分58秒

68_尚硅谷_Hadoop_MapReduce_概述&优点缺点

420

148

9分41秒

69_尚硅谷_Hadoop_MapReduce_核心思想

350

149

7分6秒

70_尚硅谷_Hadoop_MapReduce_官方WC源码&序列化类型

380

150

7分7秒

71_尚硅谷_Hadoop_MapReduce_编程规范

400

151

6分55秒

72_尚硅谷_Hadoop_MapReduce_WordCount案例需求分析

420

152

4分9秒

73_尚硅谷_Hadoop_MapReduce_WordCount案例环境准备

360

153

14分13秒

74_尚硅谷_Hadoop_MapReduce_WordCount案例Mapper

360

154

8分45秒

75_尚硅谷_Hadoop_MapReduce_WordCount案例Reducer

430

155

10分58秒

76_尚硅谷_Hadoop_MapReduce_WordCount案例Driver

470

156

15分20秒

77_尚硅谷_Hadoop_MapReduce_WordCount案例Debug调试

370

157

12分41秒

78_尚硅谷_Hadoop_MapReduce_WordCount案例集群运行

500

158

6分29秒

79_尚硅谷_Hadoop_MapReduce_序列化概述

380

159

8分18秒

80_尚硅谷_Hadoop_MapReduce_自定义序列化步骤

450

160

9分8秒

81_尚硅谷_Hadoop_MapReduce_序列化案例需求分析

410

161

6分50秒

82_尚硅谷_Hadoop_MapReduce_序列化案例FlowBean

420

162

8分59秒

83_尚硅谷_Hadoop_MapReduce_序列化案例FlowMapper

420

163

4分49秒

84_尚硅谷_Hadoop_MapReduce_序列化案例FlowReducer

450

164

6分20秒

85_尚硅谷_Hadoop_MapReduce_序列化案例FlowDriver

400

165

7分53秒

86_尚硅谷_Hadoop_MapReduce_序列化案例debug调试

350

166

15分18秒

87_尚硅谷_Hadoop_MapReduce_切片机制与MapTask并行度决定机制

360

167

20分33秒

88_尚硅谷_Hadoop_MapReduce_Job提交流程

320

168

19分16秒

89_尚硅谷_Hadoop_MapReduce_切片源码

380

169

4分59秒

90_尚硅谷_Hadoop_MapReduce_切片源码总结

530

170

3分13秒

91_尚硅谷_Hadoop_MapReduce_FileInputFormat切片机制

370

171

4分38秒

92_尚硅谷_Hadoop_MapReduce_TextInputFormat

430

172

10分17秒

93_尚硅谷_Hadoop_MapReduce_CombineTextInputFormat

320

173

16分42秒

94_尚硅谷_Hadoop_MapReduce_MapReduce工作流程

450

174

6分21秒

95_尚硅谷_Hadoop_MapReduce_Shuffle机制

390

175

12分49秒

96_尚硅谷_Hadoop_MapReduce_默认HashPartitioner分区

450

176

7分19秒

97_尚硅谷_Hadoop_MapReduce_自定义分区案例

370

177

7分19秒

98_尚硅谷_Hadoop_MapReduce_分区数与Reduce个数的总结

360

178

14分13秒

99_尚硅谷_Hadoop_MapReduce_排序概述

400

69_尚硅谷_Hadoop_MapReduce_核心思想

我来说两句

作者

相关推荐

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐