文章/答案/技术大牛

发布

首页视频111_尚硅谷_Hadoop_MapReduce_MapTask源码

111_尚硅谷_Hadoop_MapReduce_MapTask源码

2022-12-022022-12-02 16:02:19播放46

点赞0 收藏 0

2.尚硅谷大数据学科--核心框架/尚硅谷大数据技术之Hadoop3.x/视频/111_尚硅谷_Hadoop_MapReduce_MapTask源码.mp4

原链接：http://www.atguigu.com/

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:00
好，接下来呢，给大家讲解一下map task和reduce task一个源码解析，那这个源码解析啊，呃，非常重要，对于你理解这个map底层的一个工作原理至关重要，那行，那在讲这个之前，我们先给大家来盯两张图拿出来。Map task。对吧？哎，把这张图拿过来，那下面这张图啊，一会我们讲到这reduce textag的时候再给大家拿出来啊，那我们先来走到这个地方，对吧？哎，下面这里其实有这个正常运行的步骤啊，这个步骤也有啊，如果你是第一遍来学习的话，那建议大家呢，先看一遍这里面流程，然后再执行。那我这里面找一个案例啊，给大家进行一个运行，呃，以前呢，我讲课呢，是用这个word count，现在啊，我升级一下，哎，换成这个partan也是增加分区。对吧，诶加大点难度哈，那这样呢，我们就能看到这个分区里面相关的一些源码。啊，那这个还还记得吗？这个案例，这个案例啊，我们是统计手机号。
01:02
对吧。诶，统一手机号将136开头的放到1361个文件里面，然后137放到另一个138 139以及其他的一共形成几个文件一形成五个文件啊，哎，是这个案例，那我们怎么运行呢？第bug运行一下。来到这里面提前打断点，断点啊，这里面我们在。Map，哎，这个right这个方法，这个地方打个断点，Reduce里面我也提前打一个。我也在这个位置打上一个啊，防止这个过过头哈，接下来回到这之后，我们开始准备运行，检查一下你的输出路径是否存在out put666。找一下。目前一个也没有吧，好，那这一步过了，那再回来准备开始执行。右键。执行。第八个走。好来到这个位置，那现在啊，就相当于我们这个位置对吧，然后下一步我再进入到这个right方法，是不是就进入到这个环形缓冲区了，那看一看是不是这样的。
02:05
那我怎么走呢？点击进入走进来，进来之后进入到right方法继续进，再进，进到这儿还是right，那继续往里面找，哎，进来进来之后熟悉的方法吧，对吧，哎，收集器，Client收集器，然后这里面有一个它的参数，里面有个get part，那我们进去呗，走。进对吧，这是我们自定义的part。进来，那进来之后想进去观看一下，进走到这，这是我们自己写的，往下走，往下走对吧，哎，走。啊，那出去走走。然后我再执行。进入啊，进入看进到哪里了，进入到这个。那collect就是这个环形缓冲区，那环形缓冲区里面做了什么事呢？往下看往下走，哎，前面这些初始化我们不用看，你看写的比较严谨哈，也就说出现问题直接跑一层属于这种。
03:02
那再往下走。往下。往下走好到这儿到这儿之后，你看一下我们这张图当中啊，我们说啊，我们这个数据存储的呢，一部分是原数据，另一部分呢，是实实在在的数据，那原数据当中有partan key star value star，还有个index是吧？哎，那你观察一下这几个值的变化哈，然后右边的这个数据呢，有key有value啊。好，往下，你看这是谁，这叫k star，哎，其实呢，就是环形缓八，环形缓冲区的指针给了K啊K，这时候k star吗？来往下。往下走，然后看一下这个key star啊，它有要求。有什么要求呢？说这个k star，我需要对它进行一个趋化。那为什么这个star要求序列化呀？思考一下，之前咱讲过，说你这个map test有可能在102这台服务器上。那我未来radio有可能在103上。
04:01
那我这个K需要跨节点的一个通讯，那它必须支持虚列化，哎，这就是一个原因啊，好，那继续往下走，嗯，往下看这是序列化，下面再找，哎，Key start完事之后，那接下来就是Y0STAR，哎，继续呢，也必须支持序列化，好。这是看到两个支点了，那再往下走，往下看下下下下。好到这个位置。看一下这位置，这个位置说有k meter。Kiwi，那kwi里面有谁呢？有一个partan partan，有一个kwi start k start，还有一个value start，对吧，那还差一个index，那index就这位置。那你看不就全都对上了吗？啊，往下看呗，往下走走走。是吧，哎，下来了，那后面这个kv index还可以通过公式进行一个计算。OK。那这就写出去一条了吧，诶CONTEXT1条条往上写吗？往下走再出再走对吧？诶你看进入到map方法里面，这一行内容是不是就全完了。
05:09
那就写完了，那写完之后，那接下来是怎么办，接下来是不是写下一行啊，那好，那你看啊往下走。然后走，你看回到哪了，又回到这个map里了吧，哎，继续下进，哎又进来，进来之后诶进。嗯，这个呢，是。出去出去之后下一个进他了吧，进他之后我再进。进完之后我再出去，然后再进。你看又回到对应的这个map方法里面。那时候一行一行读，把你所有的这行内容全都读完呢，哎，那我读多少呢，你看一下你的输入文件。输入文件当中，在这个位置有一个input part floor。这里面。我这个原始数据有多少行呢？一共有22行，那22行的话，我这都加一起能达到环形缓冲区溢出的标准吗？
06:06
它一共是100兆，到达80%都才一写，那我猜猜22条能吗？不能对吧，那不能的话呢，它还有一个处罚条件，就是你所有的文件全读完之后。那我也可以触发一次一些。那好，那这里面我们就快说啊，你看最后两条，什么叫158，嗯幺三，我盯一下吧，盯出来。啊，执行到这个位置的时候，我们要注意一下，现在呢，我们就可以快速的往下走了哈。这个拿走。怎么快手呢，看这位置，现在我处理的是1384544121啊，那我全速运行走139。139182。841135再找159137136150还挺多哈，13560不是134不是136139135182137。
07:04
13568433656，对吧，这是第一次出现，我再来一次，是不是第二次出现，哎，第二次出现好我们进去。进入进入之后继续进入。然后再继续进入。好，来到这位置，来到这个位置呢，我继续进入，进入get爬，然后出来出来之后。进入对吧，你看吧，我又回到了这个环形缓冲区client，那好，那这是最后一遍了啊，最后一遍往下走，看看它出现什么情况。往下走走走。对吧，又执行了这个数据的一个处理，往下往下下面呢，是原数据处理好结束了，结束之后走。走。好，出来又进到这里面啊，那进到这里看一看，他这次还会不会再进入到map方法下面。说不出来了，哎，现在呢，就进入到这个clear up方法了，那clear up里面有内容吗？没有，那没有的话看他怎么处理啊走。
08:05
好，诶。你看跳出来吧，哎跳出来了，跳出来之后往下看，哎往下走，走到什么位置呢？走到这个位置。Close，哎，相当于是现在是最后一次执行了，因为已经所有数据都读完了，读完之后，那么这里面有一个close，看他close之前干了什么事，别着急，到这儿之后进入。哎，进进来之后啊，这有一个collect刷写，哎往出刷，哎这个close也打个端点哈，这两个个端点，那它怎么往外刷的呢？你说怎么把你环形缓冲去的内容刷到磁盘的呢？那看一下里面内容进。进来进来之后你想啊，他在刷紧之前，我们之前说他要干什么事儿，他要进行快排呀，这要排序啊，那你看往下找能不能找到排序。下走走。再往下，别着急，嗯，别着急往下走。好，走走。
09:02
走到这个位置看啊，这个叫什么叫排序N的一写对吧，哎，排序，那排序是这个位置一写呢，是这。行，那马上要见到真相了哈，往下看，走走到这儿走，哎，然后呢，进来。对吧，哎，进来进来这里面一定是有排序和一写相关操作啊，看一看是不是这样的，我提前打个断点，在这位置个断点啊，啊往下看往下。好，来到这个地方先排序，那排序就进去看一看呗，进来进来之后啊，你看啊，这里面它的参数是一个方法，那我第一次点击进入，它会进入到这里面。我进对吧，哎进get盘那我都得出来。那我第20进是不是进到它了，哎，第20进进来进来之后，那下边这个地方。走走，哎，这就是具体的快牌的逻辑，看快排的逻辑，一直快牌吧，哎，好，那这个我就不详细看了啊，快牌的算法我就给大家讲了出来，哎，出来出来之后再往下走，现在呢，相当于是排完序了，哎，那排完序往下走呗。
10:08
接下来看，排完序之后准备往出溢写，那一写的话，你看我这里面有几个。分区啊。看一下啊，想一下我那个是136137138139啊139，然后还有一个其他是五个分区啊五个分区，那我是要一写五个文件吗。思考一下，我是要一起五个文件吗？不是，哎，它仍然是放到一个文件里哈，只不过呢，放到一个文件里面呢，它是有这个索引位置进行标记出来，你是哪一个分区的，是这样一个分组。好，那往下看，那到这儿的时候呢，我们来看一个文件啊，看一个什么文件呢。看上面这个地方。这地方有个ta high洞大哥啊ma red local啊local rener，然后这下面一直到这到哪呢，一直往下看。
11:05
哎，这里面产生了一个spill out0这一个文件，那看一看有没有对吧？哎，咱们看一看说这里面有一个文件。嗯，来到这里面D盘temp hi，大海哥，然后map red local runner好进来之后。找到最后一个叫造把缓冲缓冲之后啊，你这个日期诶排下去哈，倒序最上面一个，然后点开点开你看这里面还真有一个密写文件，然后你右键打开。目前是什么样的，目前是空的吧，啊目前它是空的。那下面我们来看，再回到这个源码，那空的话呢，现在你看我干嘛，我要循环便利，每一个分区一共五个分区，对吧，分区内都是有序的，那好，那看他干什么事儿，往下走，往下走。这个可以缩小。啊，往下走走。
12:02
看这位置。他开始这个往里面赋值，赋这个key start和value start，那你看是用什么操作的。他所有的排序操作，其实针对的都是这个索引，对吧，而且往出写的时候也是按照索引的位置往出写。啊，这就是之前咱们说的，它排序的时候啊，是按照K的索引进行排，并没有移动你原始的存储数据的位置。那简单往下看，往下走，这是走第一个分区啊，这是第一个分区啊，一直往出写，再写处理。好，往出斜斜。走走好，第一个分区啊，零号分区处理完了对吧，那先往下，你看现在这个分区变成哪个分区了，一号分区了吧，那你看一下这里面有没有数据了。再回来对吧，现在还是零吧，刷新，然后我右键打开。看到吗？里面就有相应的内容了，你看就这么神奇。嗯，就是通过这样先写第一个分区对吧，然后再写第二个分区，第三个分区，一直写到是不是第五个分区就结束了，那这块我就不在这儿一直打到那什么了啊，一直等了，那怎么办呢？你看我现在是零号分区选完了，那现在开始第一号分区啊。
13:11
二分区再来三号分区，四号分区好五号分区是吧，哎，五号分区，那五号分区的话，那这边我就慢一点了哈，我给他走走下去。好，往下往下。往下。走走走，Close出来。哎，解锁出来走往下往下看。继续，哎，走到这位置，这个位置要打个断点叫mege and part啊，那这又是什么位置了，你现在已经产生了一写文件，那我对这个一写文件要干些干些什么事。说末的，哎，末的规定好，那你产生了一起文件，我要进行末的规定，那我进去看一看。进去。进去之后往下走。看。
14:00
看这行代码，这行代码说我遍列所有的一写文件看到了，那我现在有几个一写文件，我这里面是不是现在只有一个一写文件对吧？哎，只有一个一写文件，那一些文件之后象征性的是不是也得变了一下，你看哎象征性的处理一下出来了。那你处理完之后，他发现啊，我把所有的文件一写完之后，是不是只剩一个了。对吧？哎，如果你只有一个的话，那这个SP1写的文件就是最终输出的文件，这不很简单吗？因为你不管你一写多少次，我最终需要把你这个文件合并成一个文件。哎，让别人来读这不就OK了吗？那别人读的时候呢，是按照哎，这是零号分区，一号分区，二号分区，三号分区，四号分区来拉取自己指定分区的数据不就完了吗？这样吗？哎，好，那你都能看到啊，那我们再往下看啊，这块呢是处理啊。输出走，哎，排序结束了啊，这次排序结束结束之后，你看一下我这里有没有变化，看到没。哎，我这个规避完事之后会产生一个index文件，那这个index文件有什么用啊，啊，大家说有什么用。
15:08
你想啊，我这个呢，是实实在在存储的数据内容，对吧，按分区好放好了。那我reduce来拉取数据的时候，我怎么知道我拉的这个数据是从哪开始，从哪结束啊，谁来告诉我，那这个就是那个账本index，哎，我一读一下这文件啊，一看我这是一号分区，那我从这了，好，那如果是三号分区0123，那我从这把数据读走。这就OK。所以说哎，现在呢，我们也已经走到了这个墨迹归并完之后了，对吧，哎，好，那往下看呗。这下。走。啊啊，那搜集器collect结束，那map阶段现在呢，至此就整个马上要结束了啊，那结束之前要注意啊，它map test结束之后是不是要发往radio task，那发往radio task的时候，你要提前在radio task打一个断点啊，在哪个地方呢？嗯。
16:07
Reduce task啊，标上在这个high do map right啊，这个是就一篇没问题啊，啊来到这里面看一下在哪打断点呢，搜索一下它is map or reduce。来到这个位置，然后打上站点，这样呢，它下面我在执行这个map test的时候，他就不会跑了啊，不会跑了啊，心态心留底了，然后呢，接下来我们开始执行啊，继续往下走。走，哎结束了对吧，哎结束结束。结束之后再找，再找。这种。马上要结束了啊，看好好来，你看一下子就跳到了哪啊，Reduce task跳到这个地方啊，一定要提前打断点啊，你不提前打断点抓不到对应的这个位置。

展开

我来说两句

0 条评论

登录后参与评论

作者

腾讯云开发者课程

【合辑】尚硅谷大数据技术之Hadoop3.x

（22/178）

8分30秒

01_尚硅谷_Hadoop_开篇_课程整体介绍

670

4分33秒

02_尚硅谷_Hadoop_概论_大数据的概念

610

7分21秒

03_尚硅谷_Hadoop_概论_大数据的特点

460

9分57秒

04_尚硅谷_Hadoop_概论_大数据的应用场景

410

8分16秒

05_尚硅谷_Hadoop_概论_大数据的发展场景

380

6分24秒

06_尚硅谷_Hadoop_概论_未来工作内容

390

7分28秒

07_尚硅谷_Hadoop_入门_课程介绍

450

2分59秒

08_尚硅谷_Hadoop_入门_Hadoop是什么

470

5分50秒

09_尚硅谷_Hadoop_入门_Hadoop发展历史

470

15分24秒

100_尚硅谷_Hadoop_MapReduce_全排序案例

510

3分6秒

101_尚硅谷_Hadoop_MapReduce_二次排序案例

360

6分52秒

102_尚硅谷_Hadoop_MapReduce_区内排序案例

350

7分17秒

103_尚硅谷_Hadoop_MapReduce_Combiner概述

430

12分32秒

104_尚硅谷_Hadoop_MapReduce_Combiner案例

490

3分41秒

105_尚硅谷_Hadoop_MapReduce_outputformat概述

330

4分21秒

106_尚硅谷_Hadoop_MapReduce_自定义outputformat案例需求分析

310

4分32秒

107_尚硅谷_Hadoop_MapReduce_自定义outputformat案例mapper&reducer

390

12分31秒

108_尚硅谷_Hadoop_MapReduce_自定义outputformat案例执行

470

3分45秒

109_尚硅谷_Hadoop_MapReduce_MapTask工作机制

330

5分57秒

10_尚硅谷_Hadoop_入门_Hadoop三大发行版本

420

8分59秒

110_尚硅谷_Hadoop_MapReduce_ReduceTask工作机制&并行度

410

16分56秒

111_尚硅谷_Hadoop_MapReduce_MapTask源码

460

15分23秒

112_尚硅谷_Hadoop_MapReduce_ReduceTask源码

450

9分21秒

113_尚硅谷_Hadoop_MapReduce_ReduceJoin案例需求分析

390

7分7秒

114_尚硅谷_Hadoop_MapReduce_ReduceJoin案例TableBean

450

12分33秒

115_尚硅谷_Hadoop_MapReduce_ReduceJoin案例Mapper

370

12分26秒

116_尚硅谷_Hadoop_MapReduce_ReduceJoin案例完成

530

4分14秒

117_尚硅谷_Hadoop_MapReduce_ReduceJoin案例debug

380

6分56秒

118_尚硅谷_Hadoop_MapReduce_MapJoin案例需求分析

490

13分9秒

119_尚硅谷_Hadoop_MapReduce_MapJoin案例完成

400

3分51秒

11_尚硅谷_Hadoop_入门_Hadoop优势

400

2分48秒

120_尚硅谷_Hadoop_MapReduce_MapJoin案例debug

400

15分10秒

121_尚硅谷_Hadoop_MapReduce_ETL数据清洗案例

450

10分49秒

122_尚硅谷_Hadoop_MapReduce_MapReduce开发总结

380

16分4秒

123_尚硅谷_Hadoop_MapReduce_压缩概述

300

10分21秒

124_尚硅谷_Hadoop_MapReduce_压缩案例实操

330

5分18秒

125_尚硅谷_Hadoop_Yarn_课程介绍

400

4分55秒

126_尚硅谷_Hadoop_Yarn_基础架构

440

6分42秒

127_尚硅谷_Hadoop_Yarn_工作机制

400

3分35秒

128_尚硅谷_Hadoop_Yarn_全流程作业

340

4分17秒

129_尚硅谷_Hadoop_Yarn_FIFO调度器

380

2分59秒

12_尚硅谷_Hadoop_入门_Hadoop1.x2.x3.x区别

440

10分23秒

130_尚硅谷_Hadoop_Yarn_容量调度器

370

19分24秒

131_尚硅谷_Hadoop_Yarn_公平调度器

480

14分48秒

132_尚硅谷_Hadoop_Yarn_常用命令

500

10分25秒

133_尚硅谷_Hadoop_Yarn_生产环境核心参数配置

350

4分14秒

134_尚硅谷_Hadoop_Yarn_Linux集群快照

380

15分30秒

135_尚硅谷_Hadoop_Yarn_生产环境核心参数配置案例

330

5分42秒

136_尚硅谷_Hadoop_Yarn_生产环境多队列创建&好处

360

12分39秒

137_尚硅谷_Hadoop_Yarn_容量调度器多队列案例

370

6分50秒

138_尚硅谷_Hadoop_Yarn_容量调度器任务优先级

350

15分5秒

139_尚硅谷_Hadoop_Yarn_公平调度器案例

360

6分24秒

13_尚硅谷_Hadoop_入门_HDFS概述

470

5分11秒

140_尚硅谷_Hadoop_Yarn_Tool接口案例环境准备

370

19分14秒

141_尚硅谷_Hadoop_Yarn_Tool接口案例完成

430

10分25秒

142_尚硅谷_Hadoop_Yarn_课程总结

420

14分13秒

143_尚硅谷_Hadoop_生产调优手册_核心参数_NN内存配置

240

3分11秒

144_尚硅谷_Hadoop_生产调优手册_核心参数_NN心跳并发配置

330

7分15秒

145_尚硅谷_Hadoop_生产调优手册_核心参数_开启回收站

370

5分54秒

146_尚硅谷_Hadoop_生产调优手册_HDFS压测环境准备

390

18分53秒

147_尚硅谷_Hadoop_生产调优手册_HDFS读写压测

400

8分24秒

148_尚硅谷_Hadoop_生产调优手册_NN多目录配置

280

8分41秒

149_尚硅谷_Hadoop_生产调优手册_DN多目录及磁盘间数据均衡

350

6分34秒

14_尚硅谷_Hadoop_入门_YARN概述

400

10分0秒

150_尚硅谷_Hadoop_生产调优手册_添加白名单

350

13分6秒

151_尚硅谷_Hadoop_生产调优手册_服役新服务器

370

3分16秒

152_尚硅谷_Hadoop_生产调优手册_服务器间数据均衡

340

7分45秒

153_尚硅谷_Hadoop_生产调优手册_黑名单退役服务器

330

11分20秒

154_尚硅谷_Hadoop_生产调优手册_存储优化_5台服务器准备

390

8分15秒

155_尚硅谷_Hadoop_生产调优手册_存储优化_纠删码原理

320

10分40秒

156_尚硅谷_Hadoop_生产调优手册_存储优化_纠删码案例

390

8分34秒

157_尚硅谷_Hadoop_生产调优手册_存储优化_异构存储概述

430

17分39秒

158_尚硅谷_Hadoop_生产调优手册_存储优化_异构存储案例实操

380

9分8秒

159_尚硅谷_Hadoop_生产调优手册_NameNode故障处理

430

1分54秒

15_尚硅谷_Hadoop_入门_MapReduce概述

500

18分31秒

160_尚硅谷_Hadoop_生产调优手册_集群安全模式&磁盘修复

360

9分18秒

161_尚硅谷_Hadoop_生产调优手册_慢磁盘监控

420

8分10秒

162_尚硅谷_Hadoop_生产调优手册_小文件归档

410

3分17秒

163_尚硅谷_Hadoop_生产调优手册_集群数据迁移

340

2分42秒

164_尚硅谷_Hadoop_生产调优手册_MR跑的慢的原因

370

12分25秒

165_尚硅谷_Hadoop_生产调优手册_MR常用调优参数

390

5分25秒

166_尚硅谷_Hadoop_生产调优手册_MR数据倾斜问题

410

1分17秒

167_尚硅谷_Hadoop_生产调优手册_Yarn生产经验

370

10分13秒

168_尚硅谷_Hadoop_生产调优手册_HDFS小文件优化方法

340

2分52秒

169_尚硅谷_Hadoop_生产调优手册_MapReduce集群压测

350

3分21秒

16_尚硅谷_Hadoop_入门_HDFS&YARN&MR关系

420

14分59秒

170_尚硅谷_Hadoop_生产调优手册_企业开发场景案例

390

13分43秒

171_尚硅谷_Hadoop_源码解析_RPC通信原理解析

320

21分36秒

172_尚硅谷_Hadoop_源码解析_NameNode启动源码解析

400

22分9秒

173_尚硅谷_Hadoop_源码解析_DataNode启动源码解析

400

7分38秒

174_尚硅谷_Hadoop_源码解析_HDFS上传源码_整体介绍

370

10分12秒

175_尚硅谷_Hadoop_源码解析_HDFS上传源码_create

380

23分1秒

176_尚硅谷_Hadoop_源码解析_HDFS上传源码_write

400

21分20秒

177_尚硅谷_Hadoop_源码解析_Yarn源码解析

370

21分1秒

178_尚硅谷_Hadoop_源码解析_Hadoop源码编译

400

9分16秒

17_尚硅谷_Hadoop_入门_大数据技术生态体系

540

4分40秒

18_尚硅谷_Hadoop_入门_VMware安装

600

15分55秒

19_尚硅谷_Hadoop_入门_Centos7.5软硬件安装

520

10分49秒

20_尚硅谷_Hadoop_入门_IP和主机名称配置

540

100

9分4秒

21_尚硅谷_Hadoop_入门_Xshell远程访问工具

630

101

12分24秒

22_尚硅谷_Hadoop_入门_模板虚拟机准备完成

550

102

15分0秒

23_尚硅谷_Hadoop_入门_克隆三台虚拟机

480

103

7分0秒

24_尚硅谷_Hadoop_入门_JDK安装

460

104

7分19秒

25_尚硅谷_Hadoop_入门_Hadoop安装

560

105

11分55秒

26_尚硅谷_Hadoop_入门_本地运行模式

480

106

15分0秒

27_尚硅谷_Hadoop_入门_scp&rsync命令讲解

550

107

18分13秒

28_尚硅谷_Hadoop_入门_xsync分发脚本

460

108

11分24秒

29_尚硅谷_Hadoop_入门_ssh免密登录

410

109

13分22秒

30_尚硅谷_Hadoop_入门_集群配置

590

110

16分51秒

31_尚硅谷_Hadoop_入门_群起集群并测试

420

111

8分9秒

32_尚硅谷_Hadoop_入门_集群崩溃处理办法

410

112

5分24秒

33_尚硅谷_Hadoop_入门_历史服务器配置

410

113

5分41秒

34_尚硅谷_Hadoop_入门_日志聚集功能配置

430

114

9分17秒

35_尚硅谷_Hadoop_入门_两个常用脚本

430

115

4分14秒

36_尚硅谷_Hadoop_入门_两道面试题

520

116

11分26秒

37_尚硅谷_Hadoop_入门_集群时间同步

500

117

10分56秒

38_尚硅谷_Hadoop_入门_常见问题总结

460

118

4分22秒

39_尚硅谷_Hadoop_HDFS_课程介绍

400

119

4分10秒

40_尚硅谷_Hadoop_HDFS_产生背景和定义

480

120

5分26秒

41_尚硅谷_Hadoop_HDFS_优缺点

440

121

9分8秒

42_尚硅谷_Hadoop_HDFS_组成

530

122

8分0秒

43_尚硅谷_Hadoop_HDFS_文件块大小

410

123

9分47秒

44_尚硅谷_Hadoop_HDFS_Shell命令上传

440

124

16分40秒

45_尚硅谷_Hadoop_HDFS_Shell命令下载&直接操作

430

125

8分18秒

46_尚硅谷_Hadoop_HDFS_API环境准备

560

126

10分52秒

47_尚硅谷_Hadoop_HDFS_API创建文件夹

530

127

6分41秒

48_尚硅谷_Hadoop_HDFS_API上传

440

128

5分6秒

49_尚硅谷_Hadoop_HDFS_API参数的优先级

310

129

8分23秒

50_尚硅谷_Hadoop_HDFS_API文件下载

430

130

4分11秒

51_尚硅谷_Hadoop_HDFS_API文件删除

430

131

5分2秒

52_尚硅谷_Hadoop_HDFS_API文件更名和移动

400

132

7分56秒

53_尚硅谷_Hadoop_HDFS_API文件详情查看

390

133

3分19秒

54_尚硅谷_Hadoop_HDFS_API文件和文件夹判断

440

134

11分36秒

55_尚硅谷_Hadoop_HDFS_写数据流程

510

135

4分29秒

56_尚硅谷_Hadoop_HDFS_节点距离计算

450

136

6分6秒

57_尚硅谷_Hadoop_HDFS_机架感知（副本存储节点选择）

330

137

5分3秒

58_尚硅谷_Hadoop_HDFS_读数据流程

370

138

13分27秒

59_尚硅谷_Hadoop_HDFS_NN和2NN工作机制

390

139

9分32秒

60_尚硅谷_Hadoop_HDFS_FsImage镜像文件

390

140

4分48秒

61_尚硅谷_Hadoop_HDFS_Edits编辑日志

350

141

2分33秒

62_尚硅谷_Hadoop_HDFS_检查点时间设置

410

142

7分35秒

63_尚硅谷_Hadoop_HDFS_DN工作机制

390

143

7分6秒

64_尚硅谷_Hadoop_HDFS_数据完整性

420

144

4分43秒

65_尚硅谷_Hadoop_HDFS_掉线时限参数设置

470

145

3分43秒

66_尚硅谷_Hadoop_HDFS_总结

380

146

4分22秒

67_尚硅谷_Hadoop_MapReduce_课程介绍

360

147

9分58秒

68_尚硅谷_Hadoop_MapReduce_概述&优点缺点

420

148

9分41秒

69_尚硅谷_Hadoop_MapReduce_核心思想

350

149

7分6秒

70_尚硅谷_Hadoop_MapReduce_官方WC源码&序列化类型

380

150

7分7秒

71_尚硅谷_Hadoop_MapReduce_编程规范

400

151

6分55秒

72_尚硅谷_Hadoop_MapReduce_WordCount案例需求分析

420

152

4分9秒

73_尚硅谷_Hadoop_MapReduce_WordCount案例环境准备

360

153

14分13秒

74_尚硅谷_Hadoop_MapReduce_WordCount案例Mapper

360

154

8分45秒

75_尚硅谷_Hadoop_MapReduce_WordCount案例Reducer

430

155

10分58秒

76_尚硅谷_Hadoop_MapReduce_WordCount案例Driver

470

156

15分20秒

77_尚硅谷_Hadoop_MapReduce_WordCount案例Debug调试

370

157

12分41秒

78_尚硅谷_Hadoop_MapReduce_WordCount案例集群运行

500

158

6分29秒

79_尚硅谷_Hadoop_MapReduce_序列化概述

380

159

8分18秒

80_尚硅谷_Hadoop_MapReduce_自定义序列化步骤

450

160

9分8秒

81_尚硅谷_Hadoop_MapReduce_序列化案例需求分析

410

161

6分50秒

82_尚硅谷_Hadoop_MapReduce_序列化案例FlowBean

420

162

8分59秒

83_尚硅谷_Hadoop_MapReduce_序列化案例FlowMapper

420

163

4分49秒

84_尚硅谷_Hadoop_MapReduce_序列化案例FlowReducer

450

164

6分20秒

85_尚硅谷_Hadoop_MapReduce_序列化案例FlowDriver

400

165

7分53秒

86_尚硅谷_Hadoop_MapReduce_序列化案例debug调试

350

166

15分18秒

87_尚硅谷_Hadoop_MapReduce_切片机制与MapTask并行度决定机制

360

167

20分33秒

88_尚硅谷_Hadoop_MapReduce_Job提交流程

320

168

19分16秒

89_尚硅谷_Hadoop_MapReduce_切片源码

380

169

4分59秒

90_尚硅谷_Hadoop_MapReduce_切片源码总结

530

170

3分13秒

91_尚硅谷_Hadoop_MapReduce_FileInputFormat切片机制

370

171

4分38秒

92_尚硅谷_Hadoop_MapReduce_TextInputFormat

430

172

10分17秒

93_尚硅谷_Hadoop_MapReduce_CombineTextInputFormat

320

173

16分42秒

94_尚硅谷_Hadoop_MapReduce_MapReduce工作流程

450

174

6分21秒

95_尚硅谷_Hadoop_MapReduce_Shuffle机制

390

175

12分49秒

96_尚硅谷_Hadoop_MapReduce_默认HashPartitioner分区

450

176

7分19秒

97_尚硅谷_Hadoop_MapReduce_自定义分区案例

370

177

7分19秒

98_尚硅谷_Hadoop_MapReduce_分区数与Reduce个数的总结

360

178

14分13秒

99_尚硅谷_Hadoop_MapReduce_排序概述

400

111_尚硅谷_Hadoop_MapReduce_MapTask源码

我来说两句

作者

相关推荐

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐