文章/答案/技术大牛

发布

首页视频59_尚硅谷_Hadoop_HDFS_NN和2NN工作机制

59_尚硅谷_Hadoop_HDFS_NN和2NN工作机制

2022-12-022022-12-02 16:02:19播放39

点赞0 收藏 0

2.尚硅谷大数据学科--核心框架/尚硅谷大数据技术之Hadoop3.x/视频/59_尚硅谷_Hadoop_HDFS_NN和2NN工作机制.mp4

原链接：http://www.atguigu.com/

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:00
好，接下来呢，我们讲一下第五章name node呢和secondary name node那首先呢，给大家画张图看一下。那把这个拿过来三台服务器，那我们的内部note放在哪里面呢？是不是放在102上对吧？哎，放在这里面。好，换个颜色啊。换一个绿色。OK，那大家思考一个问题哈，我这个name node里面的原数据是存储在内存当中还是存储在磁盘当中，是内存还是磁盘？思考一下。如果说我数据存储在内存当中会有什么好处，那肯定计算速度快对吧？好处计算快好，那坏处呢？大家有没有想过啊，它什么坏处啊，那如果说内存，我这台服务器一旦挂掉，那是不是所有数据全丢了，所以说可靠性要差。
01:06
那好，那有同学说，那我们就不存在这个内存里面了，我把数据啊存储在磁盘上，那存储在磁盘上好处什么呢。好处呢，是可靠性高对吧，坏处坏处是那计算速度慢呢，计算慢对吧，计算慢，那同学你想啊，他俩正好是相反的啊，性能相反。那我能不能我既用内存又用磁盘呢？说那这样我就用他俩的优点，内存一份，磁盘一份，两份数据，用来存储内部动里面数据，这不就解决了它相应的这个可靠性和计算速度的问题吗？那你再思考问题，如果是这样设计的话，你需要在内存里面计算完，然后再持久化到磁盘，对吧？哎，这两份你都要计算，那是不是效率还是低，有没有思考啊，效率仍然是低的，因为你这个磁盘拖慢了速度，计算速度。
02:11
对吧，虽然说可靠性有一定保证，但是速度呢还是比较低。那怎么办呢？哎，那我们可以采用这样哈，这样一种方式，我们存储在磁盘里啊，哎，我们一般呢，是用什么来存储数据呢，叫fslate啊FS。用它来存储数据，那现在呢，如果你往磁盘上写的话。往这里面写，随机去读写，那效率肯定低，如果是随机读写效率的，啥叫随机读写呀？比如说FS Emma里面我有一个数据，A等于十。对吧，然后呢，我对这个十进行操作，哎，客户端的访问说我需要啊A加十啊A加十，那是不是就A等于20了啊推出来A等于20，那我要更新这个FS1MA的话，那是不是就更新原来他历史的数据了，比如说对历史数据进行一个修改。
03:20
那还记得as的特性吗？它对历史数据的一个修改，效率非常低。但是它有一样是可以支持的，什么支持可以追加进行读写。就追加写追加追加，哎，我在它文件末尾一直不断的追加。我不改你历史的数据，我就A判end止记录啊，那这里面有一个文件呢，叫I啊I。啊，I这个文件它不进行计算，它只用来追加内容，比如说哎，我说A对吧，啊，最原始你是十，你是A等于十对吧，我只记住A加十，我不修改你A的值。
04:12
我就把你这个过程记录下来，比如说你，哎有你后面又又操作了，说我又这个A又进行了减30，我只记录过程。他这样记。啊，后面挺大啊。我缩小一下。好，那它是这样，哎，我只记住你A减30，然后再来，我说A呀，乘以一个。20。只记录你这个过程，我不给你计算结果，那这样效率不就高了吗？啊，那现在呢，结果就是内存当中一份数据，然后镜像文件里面存储的是结果的值。是吧，那就值，然后ID plus里面记录了当前这里面变化的步骤啊，那捋一下这个逻辑啊，比如说首先呢，我们是内存当中有一份数据。
05:06
OK，然后呢，我们镜像文件里面也存储的数据，存储着什么数据啊。是整合之后的。比如说假如说这里面没有数据也行，嗯，然后这件。这么两份。看好了啊，这两份数据它正常是这样的一个操作啊，你镜像文件里面有的数据，我加上I plus，也就说你相关的操作等于谁呢？等于你内存当中的数据。那什么时候将镜像文件和ID plus的数据加载到内存呢？就是服务器一启动的时候，我就会将它和它加载到这儿。哎，服务器一关机的时候，我就会将ID plus跟这个镜像文件进行一个合并。他就按照这个记账本对吧，你记下文件里面原来A等于十，好，那我先读这一行，说A加十。
06:05
啊，那十那之后变成了20，然后他又执行说A减30，那A减30的话就是变成了负十。对吧，然后又执行乘以这个20，那乘以20就是负200。啊，也就是说关机的时候将它两个进行一个合并，那大家在思考问题，那如果说我在这个内存启动之后，我进行了非常多的这个步骤。那每次你一关机的时候，你是不是要合并很长时间才能把这事情。结束啊。啊，合并很长时间，那这个效率啊就比较低。那我能不能说，哎，你这边。做了一些操作之后，那我就合并一些，你做了一些，我合并一些。那这时候谁能帮助他进行将这两个内容进行一个合并呢？那就是ton n就闪亮登场了，哎，他帮这两个文件定期的进行一个合并，那好，那这两个文件有没有呢？大家看一下这个集群啊。
07:05
集群呢，在这个102上pd hi open，这里面是不是有一个date呀，CD date d FS，好进来，进来之后呢，进入到这个name，然后current。进你看在这个name no的这个目录下，就有对应的ID文件，还有对应的镜像文件啊，那这里面还有什么这个edit in progress啊，那一会儿呢，给大家介绍详细介绍这里面都存储的什么信息。OK，那这是name no的路径，PWD，那还有小me呢是吧？Ton ton里面也有一个OPT model啊，Hiop date进来，DFS进，哎，Name secondary进来，进来之后current是吧？你看这里面也有这些信息，我给你截个图。
08:11
看一下这两个的区别。哎，是不是这个是到五五，这也是到五五，哎这呢是535353555，唯一差的一个就是in progress。对吧，哎，就差一个这个内容。啊，那行，那下面呢，啊，有了这个初步的印象之后，给大家再说一下对应的这个name node和ton的一个工作原理。双击。好，那首先呢是name node，然后呢一个是edit plus，还有一个是镜像文件，那这两个内容呢，都会一上电的时候加载到内存当中。好。那这个加载到内存之后啊，客户端呢，就对你这个内进行一个访问，诶比如说我这里面要进行一个增删相关的一个操作。
09:07
对它进行修改，那修改的话。他会怎么做呢？首先他会在这个edit plus里面先记录你的流程，比如说你要干什么事，我先记账，然后再更改内存，那就说要不然我我能不能先更改内存再记账呢？那假如说你先更改了内存，突然间就巧了，它断电了。那断电了，这个数据就丢了，那这个edit plus里面有记录这条数据吗？没有，那整个这条数据就丢了啊，所以说非常严谨的办法呢，就是先记账。然后再加入内存，那就说你那有同学说了，说你记完账之后他挂了。有影响吗？没影响，因为这个数据已经记录到这里面，同时它未来是不是跟它进行合并，就是当前最新的内存当中数据啊。啊，所以说这条数据呢，就不会丢OK。那这还少，那下面才更新内存当中的一个操作。
10:05
对吧，哎，这是name no的一个正常工作，那这个小蜜对不对，他是怎么工作的呢？哎，他没事呢，就问这个name no的对吧，小秘嘛，说老板需不需要服务。哎，是否需要checkpoint，就是是否需要服务，那他多少多长时间会问一次这个老大呢。哎，它有两种条件啊，两种条件第一个呢是定时时间到。那定时默认的时间呢，就是一个小时，哎，一个小时问一次，老板说需不需要服务啊，这个还是很耗身体的是吧，哎，定时一小时问，那么还有一条呢，就是edit plus里面数据满了，比如说这里面满了特别多，那一般呢，到了100万条的时候，那就赶紧把它进行合并，否则的话你再合并啊，就慢了，比如说你这里面都。嗯，这个几十个亿对吧，几十一条数据再合并的时候，那合并的效率就低了。那假如说哎正常说请求执行踹拍的，哎这个老板答应了说哎可以服务了。
11:03
那可以服务的时候，它就会将当前这个editid plus记录，这个账本叫滚动啊，滚动怎么滚的呢？它是这样滚的啊，首先它会生成一个新的I progress啊002，你原来是001，那我002。这个期间，那如果你生成它之后，这个期间外部来正好来访问了，那它的操作会往哪里进呢？往这个002里面进。啊，这是这个事，好，它生成这个002之后，然后将原来这个001修改名称为I001。比如说当前这一时刻，他所有的账本变成了他。那再来的后续进入到这里面去。啊，这样一个流程，那行那再走，那这个时候呢，小蜜就会将镜像文件和edit plus都拉取过来。拷贝，拷贝到这边之后，它会把镜像文件和ID plus加载到内存。
12:04
哎，加到这加载到内存之后，它会按照对应的这个账本进行一个一个执行操作，最终会形成一个新的FS image。对吧，哎，然后这个后缀名叫蔡。然后把这个内容再拷贝回对应的name note，诶，拷回来。给你。给完它之后，再把原来的这个历史的FS SE ma修改名称啊覆盖啊，把它修改名称之后覆盖历史的FSSE啊已覆盖，那如果它覆盖完之后，它这里面保存的内容和它加在一起，是不是就是当前最新的原数据？对吧，那我下次再启动的时候，我就可以将它和它在加载到内存当中啊，维持当前一个正常稳定运行。对吧，那这里面能看出来这个ton和name node唯一的区别就在这。
13:01
比如说name not里面，这里面记录了最新的一个操作啊，它这里面呢是没有的啊，都是历史的一些数据啊，啊这是name note和呃托恩的一个爱恨情仇故事啊，非常简单啊。那下面呢，这里面有文字的一个介绍啊，我就不做过多说明了哈，那下节课呢，我们给大家介绍一下这个FS image和嗯，里面具体记录了哪些内容哈。

展开

我来说两句

0 条评论

登录后参与评论

作者

腾讯云开发者课程

【合辑】尚硅谷大数据技术之Hadoop3.x

（138/178）

8分30秒

01_尚硅谷_Hadoop_开篇_课程整体介绍

670

4分33秒

02_尚硅谷_Hadoop_概论_大数据的概念

610

7分21秒

03_尚硅谷_Hadoop_概论_大数据的特点

460

9分57秒

04_尚硅谷_Hadoop_概论_大数据的应用场景

410

8分16秒

05_尚硅谷_Hadoop_概论_大数据的发展场景

380

6分24秒

06_尚硅谷_Hadoop_概论_未来工作内容

390

7分28秒

07_尚硅谷_Hadoop_入门_课程介绍

450

2分59秒

08_尚硅谷_Hadoop_入门_Hadoop是什么

470

5分50秒

09_尚硅谷_Hadoop_入门_Hadoop发展历史

470

15分24秒

100_尚硅谷_Hadoop_MapReduce_全排序案例

510

3分6秒

101_尚硅谷_Hadoop_MapReduce_二次排序案例

360

6分52秒

102_尚硅谷_Hadoop_MapReduce_区内排序案例

350

7分17秒

103_尚硅谷_Hadoop_MapReduce_Combiner概述

430

12分32秒

104_尚硅谷_Hadoop_MapReduce_Combiner案例

490

3分41秒

105_尚硅谷_Hadoop_MapReduce_outputformat概述

330

4分21秒

106_尚硅谷_Hadoop_MapReduce_自定义outputformat案例需求分析

310

4分32秒

107_尚硅谷_Hadoop_MapReduce_自定义outputformat案例mapper&reducer

390

12分31秒

108_尚硅谷_Hadoop_MapReduce_自定义outputformat案例执行

470

3分45秒

109_尚硅谷_Hadoop_MapReduce_MapTask工作机制

330

5分57秒

10_尚硅谷_Hadoop_入门_Hadoop三大发行版本

420

8分59秒

110_尚硅谷_Hadoop_MapReduce_ReduceTask工作机制&并行度

410

16分56秒

111_尚硅谷_Hadoop_MapReduce_MapTask源码

460

15分23秒

112_尚硅谷_Hadoop_MapReduce_ReduceTask源码

450

9分21秒

113_尚硅谷_Hadoop_MapReduce_ReduceJoin案例需求分析

390

7分7秒

114_尚硅谷_Hadoop_MapReduce_ReduceJoin案例TableBean

450

12分33秒

115_尚硅谷_Hadoop_MapReduce_ReduceJoin案例Mapper

370

12分26秒

116_尚硅谷_Hadoop_MapReduce_ReduceJoin案例完成

530

4分14秒

117_尚硅谷_Hadoop_MapReduce_ReduceJoin案例debug

380

6分56秒

118_尚硅谷_Hadoop_MapReduce_MapJoin案例需求分析

490

13分9秒

119_尚硅谷_Hadoop_MapReduce_MapJoin案例完成

400

3分51秒

11_尚硅谷_Hadoop_入门_Hadoop优势

400

2分48秒

120_尚硅谷_Hadoop_MapReduce_MapJoin案例debug

400

15分10秒

121_尚硅谷_Hadoop_MapReduce_ETL数据清洗案例

450

10分49秒

122_尚硅谷_Hadoop_MapReduce_MapReduce开发总结

380

16分4秒

123_尚硅谷_Hadoop_MapReduce_压缩概述

300

10分21秒

124_尚硅谷_Hadoop_MapReduce_压缩案例实操

330

5分18秒

125_尚硅谷_Hadoop_Yarn_课程介绍

400

4分55秒

126_尚硅谷_Hadoop_Yarn_基础架构

440

6分42秒

127_尚硅谷_Hadoop_Yarn_工作机制

400

3分35秒

128_尚硅谷_Hadoop_Yarn_全流程作业

340

4分17秒

129_尚硅谷_Hadoop_Yarn_FIFO调度器

380

2分59秒

12_尚硅谷_Hadoop_入门_Hadoop1.x2.x3.x区别

440

10分23秒

130_尚硅谷_Hadoop_Yarn_容量调度器

370

19分24秒

131_尚硅谷_Hadoop_Yarn_公平调度器

480

14分48秒

132_尚硅谷_Hadoop_Yarn_常用命令

500

10分25秒

133_尚硅谷_Hadoop_Yarn_生产环境核心参数配置

350

4分14秒

134_尚硅谷_Hadoop_Yarn_Linux集群快照

380

15分30秒

135_尚硅谷_Hadoop_Yarn_生产环境核心参数配置案例

330

5分42秒

136_尚硅谷_Hadoop_Yarn_生产环境多队列创建&好处

360

12分39秒

137_尚硅谷_Hadoop_Yarn_容量调度器多队列案例

370

6分50秒

138_尚硅谷_Hadoop_Yarn_容量调度器任务优先级

350

15分5秒

139_尚硅谷_Hadoop_Yarn_公平调度器案例

360

6分24秒

13_尚硅谷_Hadoop_入门_HDFS概述

470

5分11秒

140_尚硅谷_Hadoop_Yarn_Tool接口案例环境准备

370

19分14秒

141_尚硅谷_Hadoop_Yarn_Tool接口案例完成

430

10分25秒

142_尚硅谷_Hadoop_Yarn_课程总结

420

14分13秒

143_尚硅谷_Hadoop_生产调优手册_核心参数_NN内存配置

240

3分11秒

144_尚硅谷_Hadoop_生产调优手册_核心参数_NN心跳并发配置

330

7分15秒

145_尚硅谷_Hadoop_生产调优手册_核心参数_开启回收站

370

5分54秒

146_尚硅谷_Hadoop_生产调优手册_HDFS压测环境准备

390

18分53秒

147_尚硅谷_Hadoop_生产调优手册_HDFS读写压测

400

8分24秒

148_尚硅谷_Hadoop_生产调优手册_NN多目录配置

280

8分41秒

149_尚硅谷_Hadoop_生产调优手册_DN多目录及磁盘间数据均衡

350

6分34秒

14_尚硅谷_Hadoop_入门_YARN概述

400

10分0秒

150_尚硅谷_Hadoop_生产调优手册_添加白名单

350

13分6秒

151_尚硅谷_Hadoop_生产调优手册_服役新服务器

370

3分16秒

152_尚硅谷_Hadoop_生产调优手册_服务器间数据均衡

340

7分45秒

153_尚硅谷_Hadoop_生产调优手册_黑名单退役服务器

330

11分20秒

154_尚硅谷_Hadoop_生产调优手册_存储优化_5台服务器准备

390

8分15秒

155_尚硅谷_Hadoop_生产调优手册_存储优化_纠删码原理

320

10分40秒

156_尚硅谷_Hadoop_生产调优手册_存储优化_纠删码案例

390

8分34秒

157_尚硅谷_Hadoop_生产调优手册_存储优化_异构存储概述

430

17分39秒

158_尚硅谷_Hadoop_生产调优手册_存储优化_异构存储案例实操

380

9分8秒

159_尚硅谷_Hadoop_生产调优手册_NameNode故障处理

430

1分54秒

15_尚硅谷_Hadoop_入门_MapReduce概述

500

18分31秒

160_尚硅谷_Hadoop_生产调优手册_集群安全模式&磁盘修复

360

9分18秒

161_尚硅谷_Hadoop_生产调优手册_慢磁盘监控

420

8分10秒

162_尚硅谷_Hadoop_生产调优手册_小文件归档

410

3分17秒

163_尚硅谷_Hadoop_生产调优手册_集群数据迁移

340

2分42秒

164_尚硅谷_Hadoop_生产调优手册_MR跑的慢的原因

370

12分25秒

165_尚硅谷_Hadoop_生产调优手册_MR常用调优参数

390

5分25秒

166_尚硅谷_Hadoop_生产调优手册_MR数据倾斜问题

410

1分17秒

167_尚硅谷_Hadoop_生产调优手册_Yarn生产经验

370

10分13秒

168_尚硅谷_Hadoop_生产调优手册_HDFS小文件优化方法

340

2分52秒

169_尚硅谷_Hadoop_生产调优手册_MapReduce集群压测

350

3分21秒

16_尚硅谷_Hadoop_入门_HDFS&YARN&MR关系

420

14分59秒

170_尚硅谷_Hadoop_生产调优手册_企业开发场景案例

390

13分43秒

171_尚硅谷_Hadoop_源码解析_RPC通信原理解析

320

21分36秒

172_尚硅谷_Hadoop_源码解析_NameNode启动源码解析

400

22分9秒

173_尚硅谷_Hadoop_源码解析_DataNode启动源码解析

400

7分38秒

174_尚硅谷_Hadoop_源码解析_HDFS上传源码_整体介绍

370

10分12秒

175_尚硅谷_Hadoop_源码解析_HDFS上传源码_create

380

23分1秒

176_尚硅谷_Hadoop_源码解析_HDFS上传源码_write

400

21分20秒

177_尚硅谷_Hadoop_源码解析_Yarn源码解析

370

21分1秒

178_尚硅谷_Hadoop_源码解析_Hadoop源码编译

400

9分16秒

17_尚硅谷_Hadoop_入门_大数据技术生态体系

540

4分40秒

18_尚硅谷_Hadoop_入门_VMware安装

600

15分55秒

19_尚硅谷_Hadoop_入门_Centos7.5软硬件安装

520

10分49秒

20_尚硅谷_Hadoop_入门_IP和主机名称配置

540

100

9分4秒

21_尚硅谷_Hadoop_入门_Xshell远程访问工具

630

101

12分24秒

22_尚硅谷_Hadoop_入门_模板虚拟机准备完成

550

102

15分0秒

23_尚硅谷_Hadoop_入门_克隆三台虚拟机

480

103

7分0秒

24_尚硅谷_Hadoop_入门_JDK安装

460

104

7分19秒

25_尚硅谷_Hadoop_入门_Hadoop安装

560

105

11分55秒

26_尚硅谷_Hadoop_入门_本地运行模式

480

106

15分0秒

27_尚硅谷_Hadoop_入门_scp&rsync命令讲解

550

107

18分13秒

28_尚硅谷_Hadoop_入门_xsync分发脚本

460

108

11分24秒

29_尚硅谷_Hadoop_入门_ssh免密登录

410

109

13分22秒

30_尚硅谷_Hadoop_入门_集群配置

590

110

16分51秒

31_尚硅谷_Hadoop_入门_群起集群并测试

420

111

8分9秒

32_尚硅谷_Hadoop_入门_集群崩溃处理办法

410

112

5分24秒

33_尚硅谷_Hadoop_入门_历史服务器配置

410

113

5分41秒

34_尚硅谷_Hadoop_入门_日志聚集功能配置

430

114

9分17秒

35_尚硅谷_Hadoop_入门_两个常用脚本

430

115

4分14秒

36_尚硅谷_Hadoop_入门_两道面试题

520

116

11分26秒

37_尚硅谷_Hadoop_入门_集群时间同步

500

117

10分56秒

38_尚硅谷_Hadoop_入门_常见问题总结

460

118

4分22秒

39_尚硅谷_Hadoop_HDFS_课程介绍

400

119

4分10秒

40_尚硅谷_Hadoop_HDFS_产生背景和定义

480

120

5分26秒

41_尚硅谷_Hadoop_HDFS_优缺点

440

121

9分8秒

42_尚硅谷_Hadoop_HDFS_组成

530

122

8分0秒

43_尚硅谷_Hadoop_HDFS_文件块大小

410

123

9分47秒

44_尚硅谷_Hadoop_HDFS_Shell命令上传

440

124

16分40秒

45_尚硅谷_Hadoop_HDFS_Shell命令下载&直接操作

430

125

8分18秒

46_尚硅谷_Hadoop_HDFS_API环境准备

560

126

10分52秒

47_尚硅谷_Hadoop_HDFS_API创建文件夹

530

127

6分41秒

48_尚硅谷_Hadoop_HDFS_API上传

440

128

5分6秒

49_尚硅谷_Hadoop_HDFS_API参数的优先级

310

129

8分23秒

50_尚硅谷_Hadoop_HDFS_API文件下载

430

130

4分11秒

51_尚硅谷_Hadoop_HDFS_API文件删除

430

131

5分2秒

52_尚硅谷_Hadoop_HDFS_API文件更名和移动

400

132

7分56秒

53_尚硅谷_Hadoop_HDFS_API文件详情查看

390

133

3分19秒

54_尚硅谷_Hadoop_HDFS_API文件和文件夹判断

440

134

11分36秒

55_尚硅谷_Hadoop_HDFS_写数据流程

510

135

4分29秒

56_尚硅谷_Hadoop_HDFS_节点距离计算

450

136

6分6秒

57_尚硅谷_Hadoop_HDFS_机架感知（副本存储节点选择）

330

137

5分3秒

58_尚硅谷_Hadoop_HDFS_读数据流程

370

138

13分27秒

59_尚硅谷_Hadoop_HDFS_NN和2NN工作机制

390

139

9分32秒

60_尚硅谷_Hadoop_HDFS_FsImage镜像文件

390

140

4分48秒

61_尚硅谷_Hadoop_HDFS_Edits编辑日志

350

141

2分33秒

62_尚硅谷_Hadoop_HDFS_检查点时间设置

410

142

7分35秒

63_尚硅谷_Hadoop_HDFS_DN工作机制

390

143

7分6秒

64_尚硅谷_Hadoop_HDFS_数据完整性

420

144

4分43秒

65_尚硅谷_Hadoop_HDFS_掉线时限参数设置

470

145

3分43秒

66_尚硅谷_Hadoop_HDFS_总结

380

146

4分22秒

67_尚硅谷_Hadoop_MapReduce_课程介绍

360

147

9分58秒

68_尚硅谷_Hadoop_MapReduce_概述&优点缺点

420

148

9分41秒

69_尚硅谷_Hadoop_MapReduce_核心思想

350

149

7分6秒

70_尚硅谷_Hadoop_MapReduce_官方WC源码&序列化类型

380

150

7分7秒

71_尚硅谷_Hadoop_MapReduce_编程规范

400

151

6分55秒

72_尚硅谷_Hadoop_MapReduce_WordCount案例需求分析

420

152

4分9秒

73_尚硅谷_Hadoop_MapReduce_WordCount案例环境准备

360

153

14分13秒

74_尚硅谷_Hadoop_MapReduce_WordCount案例Mapper

360

154

8分45秒

75_尚硅谷_Hadoop_MapReduce_WordCount案例Reducer

430

155

10分58秒

76_尚硅谷_Hadoop_MapReduce_WordCount案例Driver

470

156

15分20秒

77_尚硅谷_Hadoop_MapReduce_WordCount案例Debug调试

370

157

12分41秒

78_尚硅谷_Hadoop_MapReduce_WordCount案例集群运行

500

158

6分29秒

79_尚硅谷_Hadoop_MapReduce_序列化概述

380

159

8分18秒

80_尚硅谷_Hadoop_MapReduce_自定义序列化步骤

450

160

9分8秒

81_尚硅谷_Hadoop_MapReduce_序列化案例需求分析

410

161

6分50秒

82_尚硅谷_Hadoop_MapReduce_序列化案例FlowBean

420

162

8分59秒

83_尚硅谷_Hadoop_MapReduce_序列化案例FlowMapper

420

163

4分49秒

84_尚硅谷_Hadoop_MapReduce_序列化案例FlowReducer

450

164

6分20秒

85_尚硅谷_Hadoop_MapReduce_序列化案例FlowDriver

400

165

7分53秒

86_尚硅谷_Hadoop_MapReduce_序列化案例debug调试

350

166

15分18秒

87_尚硅谷_Hadoop_MapReduce_切片机制与MapTask并行度决定机制

360

167

20分33秒

88_尚硅谷_Hadoop_MapReduce_Job提交流程

320

168

19分16秒

89_尚硅谷_Hadoop_MapReduce_切片源码

380

169

4分59秒

90_尚硅谷_Hadoop_MapReduce_切片源码总结

530

170

3分13秒

91_尚硅谷_Hadoop_MapReduce_FileInputFormat切片机制

370

171

4分38秒

92_尚硅谷_Hadoop_MapReduce_TextInputFormat

430

172

10分17秒

93_尚硅谷_Hadoop_MapReduce_CombineTextInputFormat

320

173

16分42秒

94_尚硅谷_Hadoop_MapReduce_MapReduce工作流程

450

174

6分21秒

95_尚硅谷_Hadoop_MapReduce_Shuffle机制

390

175

12分49秒

96_尚硅谷_Hadoop_MapReduce_默认HashPartitioner分区

450

176

7分19秒

97_尚硅谷_Hadoop_MapReduce_自定义分区案例

370

177

7分19秒

98_尚硅谷_Hadoop_MapReduce_分区数与Reduce个数的总结

360

178

14分13秒

99_尚硅谷_Hadoop_MapReduce_排序概述

400

59_尚硅谷_Hadoop_HDFS_NN和2NN工作机制

我来说两句

作者

相关推荐

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐