文章/答案/技术大牛

发布

首页视频26_尚硅谷_Hadoop_入门_本地运行模式

26_尚硅谷_Hadoop_入门_本地运行模式

2022-12-022022-12-02 16:02:19播放48

点赞0 收藏 0

2.尚硅谷大数据学科--核心框架/尚硅谷大数据技术之Hadoop3.x/视频/26_尚硅谷_Hadoop_入门_本地运行模式.mp4

原链接：http://www.atguigu.com/

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:00
好，接下来呢，我们来到第三章，诶这张呢就是开发的绝对重点，那么首先来看一下嗨多跑运行模式有哪几种，那这时候呢，我就会带大家去看一下这个官网啊。嗯，由于我这个网速。还挺快啊，那现在呢，已经打开了。打开之后。来到这一面。这里面是介绍了这个嗨，有哪些功能使用啊，这个我们就不看了啊，直接看这个gettinging star，比如说从这开始。进来之后往下走啊，据说大家这个英文水平啊非常棒对不对，哎，那我们来看一下啊，那首先呢，这是目的对吧？啊，然后pre care啊，就说准备的一些工作，那看一下这个。叫supported platforms，比如说支持的一个平台有哪些呢？说要求啊，Linux或者u is supported as development啊，生产平台说had Hass滨啊，这个on，这个LIS class已经运行2000个服务器节点啊，其实已经不止2000个，这个海多宝集群啊，正常的一个工作使用啊。
01:04
这样多的话，四五千个节点啊，同时工作都没有任何问题。啊，另一块呢，说Windows is also support，也就说你除了在Windows环境下部署high，那在Windows环境也能够进行部署，但是呢，说but the following stems，也说下面这些步骤啊，Fornus only，比如说仅对的是nu，你想用看这个。比如说你跳转到其他页面，OK，这是说两个系统的一个支持，那下面呢，还有说required software从硬件上搞定之后，那下面呢，就是软件上你需要准备哪些呢？第一个。比如说，你必须要准备的是Java must be store。你说JK你必须得安装，那另一个说sh must后面呢，我们会装这个SH是什么，不要着急。后面会详细说明，那再往下看说installing software啊，安装对应的软件啊，Download的下载，这是下载hioop，我们已经帮大家下载好了啊，后面呢，其实也可以教大家怎么下啊，你点进呗进去呗，进去这里面就有对应的呃，镜像啊。
02:07
呃，说prepare to start hioop集群啊，往下走，那这里面要求有Java home jdk，还有一个hideop安装，这两项我们是不是都已经安装完毕了。再往下走。哎，这个地方说now you are ready start yourop啊，In one of the three mode，比如说下面有三种运行模式分别是。本地模式local对吧？还有呢，呃，Pre pre distribute mode叫伪分布式集群，还有一个呢，叫fairly distribu mode叫完全分布式集群，那么这三者怎么理解呢？有什么不一样的地方？哎，给大家画张图啊。嗯，正常情况下呢，我们先来一个本地模式。这个呢是本地。
03:00
诶本地呢，那就是单台服务器，比如说就是hide。还多100吧，啊，还多100。就这一台服务器，同时呢，这里的配置，比如说读取的文件信息吧。数据。存储。在Linux本地。在Linux本地磁盘上就能够读到对应的这个数据，那这种方式呢，就是local模式，那再来一种。那对应的就是伪分布式。伪分布式呢，那这里面我们比如说放在101上，它也是一台服务器，那区别是数据存储在。HTS。还记得HS是的吗？一个数据储件。那你看一下区别，一个是存储在自己的文件系统管理，另一个呢是由Linux帮他去管理这个文件，那这是为什么是。
04:05
那还有一个。叫完全分布式。幺零。二吧，嗯，零二开始。能不能放下啊？嗯。行变一下颜色，那这里面102103。104构成了这个完全分布式。哎，完全不是集群。扩一下。下一生质地。那这也是完全复式，那它跟上面有什么区别，那它的数据也是存储在ADS。
05:02
同时我是多台服务器工作。哎，这就是区别啊，这三种模式，那这三种模式在什么场景下用呢？那谁家说一下这个本地这种在生产环境下不用测试，偶尔用一下。只是在测试啊，偶尔吧，非常少啊，也就给你们今天上课会用一下，后续呢就不会再用了，那像这个伪分布式，伪分布式啊，往往是公司。中没有钱。啊，不能说没有钱是吧，比较差钱。要差钱。那他就用这个伪分布式啊，确实有这种公司啊，但是非常非常少啊，之前我还遇到那个一个老学员啊，他跟我说他们公司每天的数据量呢，只有两兆，还在做大数据。然后呢，只给他分配了一个16G内存的一台服务器，只给了一台。
06:04
那怎么办？那只能搭这种伪分布式啊，可以正常使用，而且这家公司啊，这个口气非常非常非常大哈，是吧，你要给我做一套集群，能够适配每天两兆，到未来每天一个TB数据的集群。然后就给他分配了一个C台。嗯，这个16G内存的一台服务器啊。这个各种7788的公司都有啊，这个大家呀。这个见多了就知道了啊这个。领导啊，各种给你画饼，说我们要未来要上市，嗯。公司才20个人。这个说啥都有哈，那不管他那这种公司呢，呃，我们一般呢，呃，就是尽量少去哈，我们还是要这种正规的，有这种大的数据量，还有呢，这种正规这种集群啊的公司，我们再去啊。那如果是完全不是的话，通常在企业里面。大量使用。啊，几乎每家公司，只要你是一个真正做大数据的，都会有这种生产环境的集群，那我们后续呢，都是按照这种方式进行一个搭建。
07:03
那说了这么多，那我们下面开始干活呗，哎，首先来测试一下这个本地模式对吧？哎，先把这个最low呢给大家演示一下什么叫大数据。嗯，我们在。打开大。在这个目录下呀，啊，创建一个文件。Make d WC input文件夹，然后进入到这个WC input就是它啊。进来之后创建一个文件VM。起个什么名字呢？叫word吧，word.t。那这里面放一些单词，那咱们班有什么这个名人吗？哎，宋宋是吧，哎宋宋老师是名人。汤老师也是名人，汤老师，嗯，还有谁呢，班长？嗯，再来一个波波老师。波波，嗯，还有呢，杨哥。行，那这么多人物是吧？啊，英雄人物好OK，那现在呢，我们要干一件什么事呢？我们这里面是有待处理的数据，对不对啊，一堆单词，我就想统计每一个单词出现的次数，最终告诉我说送送两次。
08:15
苍老师两次，还有一个是波波。一次啊，杨哥一次。哎，给我出这么一个清单，那中间自然要经过MR程序，比如说map程序。这是输入端，这面呢，是输出端要干这么件事情。那开始吧。对，出来啊，来到当前这个路径下，然后洞。对吧，哎，海毒，因为我已经配置了全球环境变量，我直接打海毒火就能出来，他是谁的，他是这里面的命令哈，你看一下。对吧，哎，在这儿呢哈，那当然了，你说这个前期啊，这个对这个路径不太熟，那你可以这样。In，还法这样可以吧，哎，然后执行一个价包，那这个价包在哪呢？在这个赛尔下。
09:06
分享，然后你按一下table宝键，这个一定要会啊，就用下面提示，然后还啊，然后你按一下table宝键。对吧，也有提示，那这个程序在MA6啊，打一个M，一按table包键，然后再按ta包键。出来这么多家包，那我们这里面选择的就是hidoop map它。打一个HK吧。出来他然后打一个E在推广。这就OK了，对吧，按到这按这个CTRL加L就来到这个页面，那行那指向这个它之后，那这里面你看这个加包，它叫一个脏抛丝。啥意思？就是这里面它不光有一个案例，它有多个案例，那我现在呢，只想执行一个word count案例，那你就需要告诉他，我执行的是word count案例。诶指向那好，那记住后续我们所有写的这个map reduce程序，它必须指定对应的输路径和输出路径。
10:07
而且输出路径还不能存在，如果存在的话，直接跑一场。那我们来先来看一下啊，我们的输入数据在哪呢？按一下包键，是不是当前目录下的WC input呀啊。WC inputt保健，那它的输出路径输出到哪呢？我们就输出到当前这个路径下的叫WC output，那这个路径有吗？在当前路径下没有吧？哎，没有。那这个。如果你不懂这个的话，那这样也行，对不对，哎，当前路径。OK，开始执行。哎，这些挺快啊。查看一下cdwc out。那这样呢，就已经计算完毕了，这里面有两个文件，一个大小三18，一个是零，哎，这个零呢是success，表示一个标记，里面并没有数据，那真正存储的数据在这里面查看数据cat。
11:00
你看。班长一次，波波一次，汤老师两次，宋送两次，杨哥一次。哎，这就是统计这个单词将的时数，好，我们退出来啊。那行，那我们再来执行一下。这个命令金寨这个WC out是不是存在啊？看好了是不存在啊，存在之后我们执行。啊，直接抛什么说file already exist，比如说这个文件已经存在了，后面呢，我会带大家去看这个源码，说为什么他抛的是这个异常走到哪的时候就抛了它。那后面我们看源码的时候会详细给大家讲啊，那现在呢，你就知道啊，我们在执行命令的时候啊，这个路输出路径是不能存在的。啊，不能存在。行，那这个就是这个本地模式啊，本地运行模式，运行了一个官方word count案例，快速了解一下这个hiop它的一个运行啊过程OK。

展开

我来说两句

0 条评论

登录后参与评论

作者

腾讯云开发者课程

【合辑】尚硅谷大数据技术之Hadoop3.x

（105/178）

8分30秒

01_尚硅谷_Hadoop_开篇_课程整体介绍

670

4分33秒

02_尚硅谷_Hadoop_概论_大数据的概念

610

7分21秒

03_尚硅谷_Hadoop_概论_大数据的特点

460

9分57秒

04_尚硅谷_Hadoop_概论_大数据的应用场景

410

8分16秒

05_尚硅谷_Hadoop_概论_大数据的发展场景

380

6分24秒

06_尚硅谷_Hadoop_概论_未来工作内容

390

7分28秒

07_尚硅谷_Hadoop_入门_课程介绍

450

2分59秒

08_尚硅谷_Hadoop_入门_Hadoop是什么

470

5分50秒

09_尚硅谷_Hadoop_入门_Hadoop发展历史

470

15分24秒

100_尚硅谷_Hadoop_MapReduce_全排序案例

510

3分6秒

101_尚硅谷_Hadoop_MapReduce_二次排序案例

360

6分52秒

102_尚硅谷_Hadoop_MapReduce_区内排序案例

350

7分17秒

103_尚硅谷_Hadoop_MapReduce_Combiner概述

430

12分32秒

104_尚硅谷_Hadoop_MapReduce_Combiner案例

490

3分41秒

105_尚硅谷_Hadoop_MapReduce_outputformat概述

330

4分21秒

106_尚硅谷_Hadoop_MapReduce_自定义outputformat案例需求分析

310

4分32秒

107_尚硅谷_Hadoop_MapReduce_自定义outputformat案例mapper&reducer

390

12分31秒

108_尚硅谷_Hadoop_MapReduce_自定义outputformat案例执行

470

3分45秒

109_尚硅谷_Hadoop_MapReduce_MapTask工作机制

330

5分57秒

10_尚硅谷_Hadoop_入门_Hadoop三大发行版本

420

8分59秒

110_尚硅谷_Hadoop_MapReduce_ReduceTask工作机制&并行度

410

16分56秒

111_尚硅谷_Hadoop_MapReduce_MapTask源码

460

15分23秒

112_尚硅谷_Hadoop_MapReduce_ReduceTask源码

450

9分21秒

113_尚硅谷_Hadoop_MapReduce_ReduceJoin案例需求分析

390

7分7秒

114_尚硅谷_Hadoop_MapReduce_ReduceJoin案例TableBean

450

12分33秒

115_尚硅谷_Hadoop_MapReduce_ReduceJoin案例Mapper

370

12分26秒

116_尚硅谷_Hadoop_MapReduce_ReduceJoin案例完成

530

4分14秒

117_尚硅谷_Hadoop_MapReduce_ReduceJoin案例debug

380

6分56秒

118_尚硅谷_Hadoop_MapReduce_MapJoin案例需求分析

490

13分9秒

119_尚硅谷_Hadoop_MapReduce_MapJoin案例完成

400

3分51秒

11_尚硅谷_Hadoop_入门_Hadoop优势

400

2分48秒

120_尚硅谷_Hadoop_MapReduce_MapJoin案例debug

400

15分10秒

121_尚硅谷_Hadoop_MapReduce_ETL数据清洗案例

450

10分49秒

122_尚硅谷_Hadoop_MapReduce_MapReduce开发总结

380

16分4秒

123_尚硅谷_Hadoop_MapReduce_压缩概述

300

10分21秒

124_尚硅谷_Hadoop_MapReduce_压缩案例实操

330

5分18秒

125_尚硅谷_Hadoop_Yarn_课程介绍

400

4分55秒

126_尚硅谷_Hadoop_Yarn_基础架构

440

6分42秒

127_尚硅谷_Hadoop_Yarn_工作机制

400

3分35秒

128_尚硅谷_Hadoop_Yarn_全流程作业

340

4分17秒

129_尚硅谷_Hadoop_Yarn_FIFO调度器

380

2分59秒

12_尚硅谷_Hadoop_入门_Hadoop1.x2.x3.x区别

440

10分23秒

130_尚硅谷_Hadoop_Yarn_容量调度器

370

19分24秒

131_尚硅谷_Hadoop_Yarn_公平调度器

480

14分48秒

132_尚硅谷_Hadoop_Yarn_常用命令

500

10分25秒

133_尚硅谷_Hadoop_Yarn_生产环境核心参数配置

350

4分14秒

134_尚硅谷_Hadoop_Yarn_Linux集群快照

380

15分30秒

135_尚硅谷_Hadoop_Yarn_生产环境核心参数配置案例

330

5分42秒

136_尚硅谷_Hadoop_Yarn_生产环境多队列创建&好处

360

12分39秒

137_尚硅谷_Hadoop_Yarn_容量调度器多队列案例

370

6分50秒

138_尚硅谷_Hadoop_Yarn_容量调度器任务优先级

350

15分5秒

139_尚硅谷_Hadoop_Yarn_公平调度器案例

360

6分24秒

13_尚硅谷_Hadoop_入门_HDFS概述

470

5分11秒

140_尚硅谷_Hadoop_Yarn_Tool接口案例环境准备

370

19分14秒

141_尚硅谷_Hadoop_Yarn_Tool接口案例完成

430

10分25秒

142_尚硅谷_Hadoop_Yarn_课程总结

420

14分13秒

143_尚硅谷_Hadoop_生产调优手册_核心参数_NN内存配置

240

3分11秒

144_尚硅谷_Hadoop_生产调优手册_核心参数_NN心跳并发配置

330

7分15秒

145_尚硅谷_Hadoop_生产调优手册_核心参数_开启回收站

370

5分54秒

146_尚硅谷_Hadoop_生产调优手册_HDFS压测环境准备

390

18分53秒

147_尚硅谷_Hadoop_生产调优手册_HDFS读写压测

400

8分24秒

148_尚硅谷_Hadoop_生产调优手册_NN多目录配置

280

8分41秒

149_尚硅谷_Hadoop_生产调优手册_DN多目录及磁盘间数据均衡

350

6分34秒

14_尚硅谷_Hadoop_入门_YARN概述

400

10分0秒

150_尚硅谷_Hadoop_生产调优手册_添加白名单

350

13分6秒

151_尚硅谷_Hadoop_生产调优手册_服役新服务器

370

3分16秒

152_尚硅谷_Hadoop_生产调优手册_服务器间数据均衡

340

7分45秒

153_尚硅谷_Hadoop_生产调优手册_黑名单退役服务器

330

11分20秒

154_尚硅谷_Hadoop_生产调优手册_存储优化_5台服务器准备

390

8分15秒

155_尚硅谷_Hadoop_生产调优手册_存储优化_纠删码原理

320

10分40秒

156_尚硅谷_Hadoop_生产调优手册_存储优化_纠删码案例

390

8分34秒

157_尚硅谷_Hadoop_生产调优手册_存储优化_异构存储概述

430

17分39秒

158_尚硅谷_Hadoop_生产调优手册_存储优化_异构存储案例实操

380

9分8秒

159_尚硅谷_Hadoop_生产调优手册_NameNode故障处理

430

1分54秒

15_尚硅谷_Hadoop_入门_MapReduce概述

500

18分31秒

160_尚硅谷_Hadoop_生产调优手册_集群安全模式&磁盘修复

360

9分18秒

161_尚硅谷_Hadoop_生产调优手册_慢磁盘监控

420

8分10秒

162_尚硅谷_Hadoop_生产调优手册_小文件归档

410

3分17秒

163_尚硅谷_Hadoop_生产调优手册_集群数据迁移

340

2分42秒

164_尚硅谷_Hadoop_生产调优手册_MR跑的慢的原因

370

12分25秒

165_尚硅谷_Hadoop_生产调优手册_MR常用调优参数

390

5分25秒

166_尚硅谷_Hadoop_生产调优手册_MR数据倾斜问题

410

1分17秒

167_尚硅谷_Hadoop_生产调优手册_Yarn生产经验

370

10分13秒

168_尚硅谷_Hadoop_生产调优手册_HDFS小文件优化方法

340

2分52秒

169_尚硅谷_Hadoop_生产调优手册_MapReduce集群压测

350

3分21秒

16_尚硅谷_Hadoop_入门_HDFS&YARN&MR关系

420

14分59秒

170_尚硅谷_Hadoop_生产调优手册_企业开发场景案例

390

13分43秒

171_尚硅谷_Hadoop_源码解析_RPC通信原理解析

320

21分36秒

172_尚硅谷_Hadoop_源码解析_NameNode启动源码解析

400

22分9秒

173_尚硅谷_Hadoop_源码解析_DataNode启动源码解析

400

7分38秒

174_尚硅谷_Hadoop_源码解析_HDFS上传源码_整体介绍

370

10分12秒

175_尚硅谷_Hadoop_源码解析_HDFS上传源码_create

380

23分1秒

176_尚硅谷_Hadoop_源码解析_HDFS上传源码_write

400

21分20秒

177_尚硅谷_Hadoop_源码解析_Yarn源码解析

370

21分1秒

178_尚硅谷_Hadoop_源码解析_Hadoop源码编译

400

9分16秒

17_尚硅谷_Hadoop_入门_大数据技术生态体系

540

4分40秒

18_尚硅谷_Hadoop_入门_VMware安装

600

15分55秒

19_尚硅谷_Hadoop_入门_Centos7.5软硬件安装

520

10分49秒

20_尚硅谷_Hadoop_入门_IP和主机名称配置

540

100

9分4秒

21_尚硅谷_Hadoop_入门_Xshell远程访问工具

630

101

12分24秒

22_尚硅谷_Hadoop_入门_模板虚拟机准备完成

550

102

15分0秒

23_尚硅谷_Hadoop_入门_克隆三台虚拟机

480

103

7分0秒

24_尚硅谷_Hadoop_入门_JDK安装

460

104

7分19秒

25_尚硅谷_Hadoop_入门_Hadoop安装

560

105

11分55秒

26_尚硅谷_Hadoop_入门_本地运行模式

480

106

15分0秒

27_尚硅谷_Hadoop_入门_scp&rsync命令讲解

550

107

18分13秒

28_尚硅谷_Hadoop_入门_xsync分发脚本

460

108

11分24秒

29_尚硅谷_Hadoop_入门_ssh免密登录

410

109

13分22秒

30_尚硅谷_Hadoop_入门_集群配置

590

110

16分51秒

31_尚硅谷_Hadoop_入门_群起集群并测试

420

111

8分9秒

32_尚硅谷_Hadoop_入门_集群崩溃处理办法

410

112

5分24秒

33_尚硅谷_Hadoop_入门_历史服务器配置

410

113

5分41秒

34_尚硅谷_Hadoop_入门_日志聚集功能配置

430

114

9分17秒

35_尚硅谷_Hadoop_入门_两个常用脚本

430

115

4分14秒

36_尚硅谷_Hadoop_入门_两道面试题

520

116

11分26秒

37_尚硅谷_Hadoop_入门_集群时间同步

500

117

10分56秒

38_尚硅谷_Hadoop_入门_常见问题总结

460

118

4分22秒

39_尚硅谷_Hadoop_HDFS_课程介绍

400

119

4分10秒

40_尚硅谷_Hadoop_HDFS_产生背景和定义

480

120

5分26秒

41_尚硅谷_Hadoop_HDFS_优缺点

440

121

9分8秒

42_尚硅谷_Hadoop_HDFS_组成

530

122

8分0秒

43_尚硅谷_Hadoop_HDFS_文件块大小

410

123

9分47秒

44_尚硅谷_Hadoop_HDFS_Shell命令上传

440

124

16分40秒

45_尚硅谷_Hadoop_HDFS_Shell命令下载&直接操作

430

125

8分18秒

46_尚硅谷_Hadoop_HDFS_API环境准备

560

126

10分52秒

47_尚硅谷_Hadoop_HDFS_API创建文件夹

530

127

6分41秒

48_尚硅谷_Hadoop_HDFS_API上传

440

128

5分6秒

49_尚硅谷_Hadoop_HDFS_API参数的优先级

310

129

8分23秒

50_尚硅谷_Hadoop_HDFS_API文件下载

430

130

4分11秒

51_尚硅谷_Hadoop_HDFS_API文件删除

430

131

5分2秒

52_尚硅谷_Hadoop_HDFS_API文件更名和移动

400

132

7分56秒

53_尚硅谷_Hadoop_HDFS_API文件详情查看

390

133

3分19秒

54_尚硅谷_Hadoop_HDFS_API文件和文件夹判断

440

134

11分36秒

55_尚硅谷_Hadoop_HDFS_写数据流程

510

135

4分29秒

56_尚硅谷_Hadoop_HDFS_节点距离计算

450

136

6分6秒

57_尚硅谷_Hadoop_HDFS_机架感知（副本存储节点选择）

330

137

5分3秒

58_尚硅谷_Hadoop_HDFS_读数据流程

370

138

13分27秒

59_尚硅谷_Hadoop_HDFS_NN和2NN工作机制

390

139

9分32秒

60_尚硅谷_Hadoop_HDFS_FsImage镜像文件

390

140

4分48秒

61_尚硅谷_Hadoop_HDFS_Edits编辑日志

350

141

2分33秒

62_尚硅谷_Hadoop_HDFS_检查点时间设置

410

142

7分35秒

63_尚硅谷_Hadoop_HDFS_DN工作机制

390

143

7分6秒

64_尚硅谷_Hadoop_HDFS_数据完整性

420

144

4分43秒

65_尚硅谷_Hadoop_HDFS_掉线时限参数设置

470

145

3分43秒

66_尚硅谷_Hadoop_HDFS_总结

380

146

4分22秒

67_尚硅谷_Hadoop_MapReduce_课程介绍

360

147

9分58秒

68_尚硅谷_Hadoop_MapReduce_概述&优点缺点

420

148

9分41秒

69_尚硅谷_Hadoop_MapReduce_核心思想

350

149

7分6秒

70_尚硅谷_Hadoop_MapReduce_官方WC源码&序列化类型

380

150

7分7秒

71_尚硅谷_Hadoop_MapReduce_编程规范

400

151

6分55秒

72_尚硅谷_Hadoop_MapReduce_WordCount案例需求分析

420

152

4分9秒

73_尚硅谷_Hadoop_MapReduce_WordCount案例环境准备

360

153

14分13秒

74_尚硅谷_Hadoop_MapReduce_WordCount案例Mapper

360

154

8分45秒

75_尚硅谷_Hadoop_MapReduce_WordCount案例Reducer

430

155

10分58秒

76_尚硅谷_Hadoop_MapReduce_WordCount案例Driver

470

156

15分20秒

77_尚硅谷_Hadoop_MapReduce_WordCount案例Debug调试

370

157

12分41秒

78_尚硅谷_Hadoop_MapReduce_WordCount案例集群运行

500

158

6分29秒

79_尚硅谷_Hadoop_MapReduce_序列化概述

380

159

8分18秒

80_尚硅谷_Hadoop_MapReduce_自定义序列化步骤

450

160

9分8秒

81_尚硅谷_Hadoop_MapReduce_序列化案例需求分析

410

161

6分50秒

82_尚硅谷_Hadoop_MapReduce_序列化案例FlowBean

420

162

8分59秒

83_尚硅谷_Hadoop_MapReduce_序列化案例FlowMapper

420

163

4分49秒

84_尚硅谷_Hadoop_MapReduce_序列化案例FlowReducer

450

164

6分20秒

85_尚硅谷_Hadoop_MapReduce_序列化案例FlowDriver

400

165

7分53秒

86_尚硅谷_Hadoop_MapReduce_序列化案例debug调试

350

166

15分18秒

87_尚硅谷_Hadoop_MapReduce_切片机制与MapTask并行度决定机制

360

167

20分33秒

88_尚硅谷_Hadoop_MapReduce_Job提交流程

320

168

19分16秒

89_尚硅谷_Hadoop_MapReduce_切片源码

380

169

4分59秒

90_尚硅谷_Hadoop_MapReduce_切片源码总结

530

170

3分13秒

91_尚硅谷_Hadoop_MapReduce_FileInputFormat切片机制

370

171

4分38秒

92_尚硅谷_Hadoop_MapReduce_TextInputFormat

430

172

10分17秒

93_尚硅谷_Hadoop_MapReduce_CombineTextInputFormat

320

173

16分42秒

94_尚硅谷_Hadoop_MapReduce_MapReduce工作流程

450

174

6分21秒

95_尚硅谷_Hadoop_MapReduce_Shuffle机制

390

175

12分49秒

96_尚硅谷_Hadoop_MapReduce_默认HashPartitioner分区

450

176

7分19秒

97_尚硅谷_Hadoop_MapReduce_自定义分区案例

370

177

7分19秒

98_尚硅谷_Hadoop_MapReduce_分区数与Reduce个数的总结

360

178

14分13秒

99_尚硅谷_Hadoop_MapReduce_排序概述

400

26_尚硅谷_Hadoop_入门_本地运行模式

我来说两句

作者

相关推荐

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐