文章/答案/技术大牛

发布

首页视频17_尚硅谷_Hadoop_入门_大数据技术生态体系

17_尚硅谷_Hadoop_入门_大数据技术生态体系

2022-12-022022-12-02 16:02:19播放54

点赞0 收藏 0

2.尚硅谷大数据学科--核心框架/尚硅谷大数据技术之Hadoop3.x/视频/17_尚硅谷_Hadoop_入门_大数据技术生态体系.mp4

原链接：http://www.atguigu.com/

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:00
好，接下来我们讲解一下大数据技术生态体系，其实啊，也就说明一下哈杜在整个大数据生态体系当中，它处于一个什么样的位置，方便我们后续的一个学习哈，那在整个大数据生态体系当中啊，它的数据源有这么三类置，分别是结构化数据，半结构化数据和非结构化数据。那什么叫结构化数据半结构化和非结构化？解释一下，那像数据库里面这种有行对吧？哎，有列这种有二维表格的就叫结构化数据，那什么叫半截化数据呢？类似一个文件，文件里面一行，但是每一行啊，还有这种分割符，哎，分割出来的一个字段，一个字段的未来呢，它可以导入到MYSQL。这种结构化数据里面，那它就叫半结构化数据，那像这个视频和PPT这种很典型的是非结构化数据，你根本就转换不了。对吧，那行有这么几种来源。那这么几种来源，我大数据框架能用哪些技术来处理它呢？比如说我们来处理这种结构化数据，用什么组件更合适呢？
01:08
那我们后面讲离线数仓的时候，用的就是这个S库框架来同步买售候里的数据到我们的，还有受仓里面。那还有我们未来还有这种像处理每个用户的用户行为数据。比如说一个用户来到网站干了什么事，对吧？哎，点赞了，评论了，还收藏了，那这种用文本形式存储的，用哪个框架来采集呢？哎，比较合适。那还有像这种视频PPT非进化数据。哎，我们可以用卡普卡来处理。那当然这个卡法呀，它也可以处理。这个半句话数据和结构化数据都可以啊，非常强大，后面我会重点给大家讲解好不好。OK，那这也叫数据传输程。那再往下走，那数据接收完之后是不是就得存了。对不对，哎，这个相当于是前台的这个。
02:01
小妹妹，对不对？哎，把客人接进来之后，你是得安排酒店住下，那住下的框架呢，就有APS h base好不好，都可以进行数据的一个存储。OK，再往上走。那上面呢，是整个集群的资源的一个调度，由他来安排。对吧，哎，安排，比如说客户能不能住得下来的人，能不能得到满意的服务，由他来管理。再往上。上面呢，就是数据的计算程。那计算呢，这里面包括像用MAP6，你说hi的组件进行计算，那还有呢，我们日后要学的10SPARK进行计算，那它俩是有区别的，你像MA6呢，是完全基于硬盘的。那Spark呢，它是有一部分是基于内存的。啊，那计算效率肯定他要高一些啊，后面会给大家先说，不用着急，那再往上呢说maps，它上面有一个have，专门来查询数据。
03:03
那想想啊，卖六呢，是需要我们写代码的。那这个效率啊要低一些，那还有呢，它类似于这种买circleq这种还口语句啊，也就是类类似circleq吧啊这种语法来查询，那是肯肯定比你写代码啊，这个可读性要强一些，所以说通常企业里面愿意用have这种语法啊来进行企业的一个开发。那再往上sparkrk呢，它上面有什么，像数据挖掘，还有Spark circle，哎，也是你这个sparkrk呢，是用RDD啊，其实是一个啊，它的一个啊，说2D点你可能不太懂啊，就是用用代码吧啊用代码来编写程序，那么代码编写程序肯定不如写SQ来的快啊，企业里面推行的这种SQL化的一种方式啊来解决。嗯，再往上这都是离线的哈，刚才说的都是离线的，那还有实时的一个计算，你说像这个双11啊，阿里要求这个实时计算当前的一个交易额。那用什么技术呢？你可以选择用Spark streaming flink，还有stone。
04:02
都是实时计算的框架，那像STEM已经可以说是过气了啊，这个只有一些老项目还在用这个STEM，新项目的话呢，要么用SPA swimming，要么用Li。而且呢，前两年用Spark streaming的要多一些，那最近呢，用这个flink的多一些。所以说flink呢，成为我们的重点，那现在我们的课程呢，光flink就已经升级到一个月以上了。啊，我们是，嗯，紧随市场的变化，市场需要什么，我们就第一时间升级对吧。再往上走，那上面呢，是这个任务的一个调度，那调度框架呢，有乌贼有阿兹卡班这么两种啊，其实还有什么阿尔flow对吧？啊，还有什么c table，其实都可以进行任务调度，那每家公司呢，这个会根据自己的任务的一个复杂程度进行一个选择。那好，那这个任务调度它能解决什么事呢？那你想啊，你整个集群当中可能有100多个任务。那我问你一个问题，这100多个任务都是同时跑吗？
05:02
不一定，对不对，那有可能有一批任务从凌晨一点开始执行，假如说这里面有五个任务，凌晨一点执行。这五个任务执行完之后，才允许执行第二批任务，有这种任务吗？有这种依赖关系的。那当然我还有说定时的，我就三点开始执行任务。可以吧，没问题。都可以，那谁来决定我这个任务什么时候执行呢？就由这个调度器进行一个配置，你想让他什么时候执行它就什么时候执行，你想让他前面几个任务执行完了再执行我这个任务也可以。都行好，那这里面还有一个主keep，比如说整个大数据平台的协调者，调度者。啊，他还记得他的logo吗？他的logo是一个动物管理员。那大数据很多框架是不是都是动物啊，哎，他其实管理这些框架了。啊，其实它叫润滑剂啊，这个辅助这些框架进行一个工作，呃，在我们大数据场景当中啊，其实主K呢，呃，我们应用的并不是特别多，你只要把它这个正常启动起来啊就OK，后面我会详细说啊，有印象。
06:12
我们对他的要求不是特别高。再往上，上面呢，是对应的这个业务层，比如说真正的这个，呃，我们要做什么事，解决什么问题，是对于业务模型的一个搭建，可视化分析，还有呢，真正的统计，比如说每天的日活，新增留存转化率等等一些指标的时候就会用到它，好先文一下，那下面呢，这里面有对应的每一个框架，对应的解释。啊，其实呢，现在也不用着急去看，后面呢，我们都会对每一个框架详细的去，呃去讲解，你大概有个印象，这样你学习起来呢，有一个整体的一个感觉啊。好，那下面呢，说一个推荐系统的一个架构图，我们来看一下说大数据生态体系，它是如何来解决问题的。那其实当前这个社会当中啊，呃，最火的一个抖音或者今日头条对不对，哎，他推荐的都是你喜欢的一些商品，对吧？还有一些电商啊，也是你在这个购买商品的时候，他都是推荐你以往浏览过的，或者你更关心的一些商品，那他是怎么做到的呢？
07:12
啊，或者说在你的APP上，你是不是还记得有一个叫千人千面，不知道听没听说过，比如说每个人的APP首页推荐的商品都不一样，比如说我呢，推荐的都是各种书啊，学习啊这种东西，那硕硕老师呢，推荐的都是这个。还有妊娠纹对吧，充满着首页各种信号啊，那行吧，那假如说宋老师哎，打开这个京东首页。然后准备购买还有人什么，那这个行为就会被记录下来。对吧，哎，前端有这种买点日志，可以把这个行为记录下来，那记录下来之后就会通过安啊负载均衡打入到日志收集的服务器里面。那他这种数据呢，通常情况下呢，是用文件形式存储的用户行为数据，那好，那数据就走到这，走到这之后由谁来采呀，由这个来采集对应的日志。
08:03
他采集完之后给谁呢？给卡卡。它叫消息队列进行一个缓冲，缓冲之后由于我们这是推荐系统，是不是得要求实时性啊，那我们直接得找这种实时任务。你可以做这个，哎，当前比较流行的是这两个。说他在这里面进行一个计算，计算宋老师，他点击这个。那他是想购买呢，还是什么，或者说我下一次给他推荐什么样的商品，能进一步的产生他的消费呢？对吧？哎，经过一计算返回给这个Java后台，对吧，那你返回的时候以什么形式存在呢？可以有两种形式，一种是这种数据库的形式，还有呢，可以以这种文件的形式存储。那不管你以哪种形式存储，你们只要协商好之后，那这里面又有一个Java后台业务，是不是把这个数据读走了，读走之后反馈给谁呀，反馈给宋老师展示的页面。对吧，哎，这就是一套大数据闭环的流程。
09:02
是吧，从这走走这走这走这走这。是吧，一直到这这么一套。哎，先有个印象，后面呢，哎，我们会有项目啊，详细给大家讲啊。

展开

我来说两句

0 条评论

登录后参与评论

作者

腾讯云开发者课程

【合辑】尚硅谷大数据技术之Hadoop3.x

（96/178）

8分30秒

01_尚硅谷_Hadoop_开篇_课程整体介绍

670

4分33秒

02_尚硅谷_Hadoop_概论_大数据的概念

610

7分21秒

03_尚硅谷_Hadoop_概论_大数据的特点

460

9分57秒

04_尚硅谷_Hadoop_概论_大数据的应用场景

410

8分16秒

05_尚硅谷_Hadoop_概论_大数据的发展场景

380

6分24秒

06_尚硅谷_Hadoop_概论_未来工作内容

390

7分28秒

07_尚硅谷_Hadoop_入门_课程介绍

450

2分59秒

08_尚硅谷_Hadoop_入门_Hadoop是什么

470

5分50秒

09_尚硅谷_Hadoop_入门_Hadoop发展历史

470

15分24秒

100_尚硅谷_Hadoop_MapReduce_全排序案例

510

3分6秒

101_尚硅谷_Hadoop_MapReduce_二次排序案例

360

6分52秒

102_尚硅谷_Hadoop_MapReduce_区内排序案例

350

7分17秒

103_尚硅谷_Hadoop_MapReduce_Combiner概述

430

12分32秒

104_尚硅谷_Hadoop_MapReduce_Combiner案例

490

3分41秒

105_尚硅谷_Hadoop_MapReduce_outputformat概述

330

4分21秒

106_尚硅谷_Hadoop_MapReduce_自定义outputformat案例需求分析

310

4分32秒

107_尚硅谷_Hadoop_MapReduce_自定义outputformat案例mapper&reducer

390

12分31秒

108_尚硅谷_Hadoop_MapReduce_自定义outputformat案例执行

470

3分45秒

109_尚硅谷_Hadoop_MapReduce_MapTask工作机制

330

5分57秒

10_尚硅谷_Hadoop_入门_Hadoop三大发行版本

420

8分59秒

110_尚硅谷_Hadoop_MapReduce_ReduceTask工作机制&并行度

410

16分56秒

111_尚硅谷_Hadoop_MapReduce_MapTask源码

460

15分23秒

112_尚硅谷_Hadoop_MapReduce_ReduceTask源码

450

9分21秒

113_尚硅谷_Hadoop_MapReduce_ReduceJoin案例需求分析

390

7分7秒

114_尚硅谷_Hadoop_MapReduce_ReduceJoin案例TableBean

450

12分33秒

115_尚硅谷_Hadoop_MapReduce_ReduceJoin案例Mapper

370

12分26秒

116_尚硅谷_Hadoop_MapReduce_ReduceJoin案例完成

530

4分14秒

117_尚硅谷_Hadoop_MapReduce_ReduceJoin案例debug

380

6分56秒

118_尚硅谷_Hadoop_MapReduce_MapJoin案例需求分析

490

13分9秒

119_尚硅谷_Hadoop_MapReduce_MapJoin案例完成

400

3分51秒

11_尚硅谷_Hadoop_入门_Hadoop优势

400

2分48秒

120_尚硅谷_Hadoop_MapReduce_MapJoin案例debug

400

15分10秒

121_尚硅谷_Hadoop_MapReduce_ETL数据清洗案例

450

10分49秒

122_尚硅谷_Hadoop_MapReduce_MapReduce开发总结

380

16分4秒

123_尚硅谷_Hadoop_MapReduce_压缩概述

300

10分21秒

124_尚硅谷_Hadoop_MapReduce_压缩案例实操

330

5分18秒

125_尚硅谷_Hadoop_Yarn_课程介绍

400

4分55秒

126_尚硅谷_Hadoop_Yarn_基础架构

440

6分42秒

127_尚硅谷_Hadoop_Yarn_工作机制

400

3分35秒

128_尚硅谷_Hadoop_Yarn_全流程作业

340

4分17秒

129_尚硅谷_Hadoop_Yarn_FIFO调度器

380

2分59秒

12_尚硅谷_Hadoop_入门_Hadoop1.x2.x3.x区别

440

10分23秒

130_尚硅谷_Hadoop_Yarn_容量调度器

370

19分24秒

131_尚硅谷_Hadoop_Yarn_公平调度器

480

14分48秒

132_尚硅谷_Hadoop_Yarn_常用命令

500

10分25秒

133_尚硅谷_Hadoop_Yarn_生产环境核心参数配置

350

4分14秒

134_尚硅谷_Hadoop_Yarn_Linux集群快照

380

15分30秒

135_尚硅谷_Hadoop_Yarn_生产环境核心参数配置案例

330

5分42秒

136_尚硅谷_Hadoop_Yarn_生产环境多队列创建&好处

360

12分39秒

137_尚硅谷_Hadoop_Yarn_容量调度器多队列案例

370

6分50秒

138_尚硅谷_Hadoop_Yarn_容量调度器任务优先级

350

15分5秒

139_尚硅谷_Hadoop_Yarn_公平调度器案例

360

6分24秒

13_尚硅谷_Hadoop_入门_HDFS概述

470

5分11秒

140_尚硅谷_Hadoop_Yarn_Tool接口案例环境准备

370

19分14秒

141_尚硅谷_Hadoop_Yarn_Tool接口案例完成

430

10分25秒

142_尚硅谷_Hadoop_Yarn_课程总结

420

14分13秒

143_尚硅谷_Hadoop_生产调优手册_核心参数_NN内存配置

240

3分11秒

144_尚硅谷_Hadoop_生产调优手册_核心参数_NN心跳并发配置

330

7分15秒

145_尚硅谷_Hadoop_生产调优手册_核心参数_开启回收站

370

5分54秒

146_尚硅谷_Hadoop_生产调优手册_HDFS压测环境准备

390

18分53秒

147_尚硅谷_Hadoop_生产调优手册_HDFS读写压测

400

8分24秒

148_尚硅谷_Hadoop_生产调优手册_NN多目录配置

280

8分41秒

149_尚硅谷_Hadoop_生产调优手册_DN多目录及磁盘间数据均衡

350

6分34秒

14_尚硅谷_Hadoop_入门_YARN概述

400

10分0秒

150_尚硅谷_Hadoop_生产调优手册_添加白名单

350

13分6秒

151_尚硅谷_Hadoop_生产调优手册_服役新服务器

370

3分16秒

152_尚硅谷_Hadoop_生产调优手册_服务器间数据均衡

340

7分45秒

153_尚硅谷_Hadoop_生产调优手册_黑名单退役服务器

330

11分20秒

154_尚硅谷_Hadoop_生产调优手册_存储优化_5台服务器准备

390

8分15秒

155_尚硅谷_Hadoop_生产调优手册_存储优化_纠删码原理

320

10分40秒

156_尚硅谷_Hadoop_生产调优手册_存储优化_纠删码案例

390

8分34秒

157_尚硅谷_Hadoop_生产调优手册_存储优化_异构存储概述

430

17分39秒

158_尚硅谷_Hadoop_生产调优手册_存储优化_异构存储案例实操

380

9分8秒

159_尚硅谷_Hadoop_生产调优手册_NameNode故障处理

430

1分54秒

15_尚硅谷_Hadoop_入门_MapReduce概述

500

18分31秒

160_尚硅谷_Hadoop_生产调优手册_集群安全模式&磁盘修复

360

9分18秒

161_尚硅谷_Hadoop_生产调优手册_慢磁盘监控

420

8分10秒

162_尚硅谷_Hadoop_生产调优手册_小文件归档

410

3分17秒

163_尚硅谷_Hadoop_生产调优手册_集群数据迁移

340

2分42秒

164_尚硅谷_Hadoop_生产调优手册_MR跑的慢的原因

370

12分25秒

165_尚硅谷_Hadoop_生产调优手册_MR常用调优参数

390

5分25秒

166_尚硅谷_Hadoop_生产调优手册_MR数据倾斜问题

410

1分17秒

167_尚硅谷_Hadoop_生产调优手册_Yarn生产经验

370

10分13秒

168_尚硅谷_Hadoop_生产调优手册_HDFS小文件优化方法

340

2分52秒

169_尚硅谷_Hadoop_生产调优手册_MapReduce集群压测

350

3分21秒

16_尚硅谷_Hadoop_入门_HDFS&YARN&MR关系

420

14分59秒

170_尚硅谷_Hadoop_生产调优手册_企业开发场景案例

390

13分43秒

171_尚硅谷_Hadoop_源码解析_RPC通信原理解析

320

21分36秒

172_尚硅谷_Hadoop_源码解析_NameNode启动源码解析

400

22分9秒

173_尚硅谷_Hadoop_源码解析_DataNode启动源码解析

400

7分38秒

174_尚硅谷_Hadoop_源码解析_HDFS上传源码_整体介绍

370

10分12秒

175_尚硅谷_Hadoop_源码解析_HDFS上传源码_create

380

23分1秒

176_尚硅谷_Hadoop_源码解析_HDFS上传源码_write

400

21分20秒

177_尚硅谷_Hadoop_源码解析_Yarn源码解析

370

21分1秒

178_尚硅谷_Hadoop_源码解析_Hadoop源码编译

400

9分16秒

17_尚硅谷_Hadoop_入门_大数据技术生态体系

540

4分40秒

18_尚硅谷_Hadoop_入门_VMware安装

600

15分55秒

19_尚硅谷_Hadoop_入门_Centos7.5软硬件安装

520

10分49秒

20_尚硅谷_Hadoop_入门_IP和主机名称配置

540

100

9分4秒

21_尚硅谷_Hadoop_入门_Xshell远程访问工具

630

101

12分24秒

22_尚硅谷_Hadoop_入门_模板虚拟机准备完成

550

102

15分0秒

23_尚硅谷_Hadoop_入门_克隆三台虚拟机

480

103

7分0秒

24_尚硅谷_Hadoop_入门_JDK安装

460

104

7分19秒

25_尚硅谷_Hadoop_入门_Hadoop安装

560

105

11分55秒

26_尚硅谷_Hadoop_入门_本地运行模式

480

106

15分0秒

27_尚硅谷_Hadoop_入门_scp&rsync命令讲解

550

107

18分13秒

28_尚硅谷_Hadoop_入门_xsync分发脚本

460

108

11分24秒

29_尚硅谷_Hadoop_入门_ssh免密登录

410

109

13分22秒

30_尚硅谷_Hadoop_入门_集群配置

590

110

16分51秒

31_尚硅谷_Hadoop_入门_群起集群并测试

420

111

8分9秒

32_尚硅谷_Hadoop_入门_集群崩溃处理办法

410

112

5分24秒

33_尚硅谷_Hadoop_入门_历史服务器配置

410

113

5分41秒

34_尚硅谷_Hadoop_入门_日志聚集功能配置

430

114

9分17秒

35_尚硅谷_Hadoop_入门_两个常用脚本

430

115

4分14秒

36_尚硅谷_Hadoop_入门_两道面试题

520

116

11分26秒

37_尚硅谷_Hadoop_入门_集群时间同步

500

117

10分56秒

38_尚硅谷_Hadoop_入门_常见问题总结

460

118

4分22秒

39_尚硅谷_Hadoop_HDFS_课程介绍

400

119

4分10秒

40_尚硅谷_Hadoop_HDFS_产生背景和定义

480

120

5分26秒

41_尚硅谷_Hadoop_HDFS_优缺点

440

121

9分8秒

42_尚硅谷_Hadoop_HDFS_组成

530

122

8分0秒

43_尚硅谷_Hadoop_HDFS_文件块大小

410

123

9分47秒

44_尚硅谷_Hadoop_HDFS_Shell命令上传

440

124

16分40秒

45_尚硅谷_Hadoop_HDFS_Shell命令下载&直接操作

430

125

8分18秒

46_尚硅谷_Hadoop_HDFS_API环境准备

560

126

10分52秒

47_尚硅谷_Hadoop_HDFS_API创建文件夹

530

127

6分41秒

48_尚硅谷_Hadoop_HDFS_API上传

440

128

5分6秒

49_尚硅谷_Hadoop_HDFS_API参数的优先级

310

129

8分23秒

50_尚硅谷_Hadoop_HDFS_API文件下载

430

130

4分11秒

51_尚硅谷_Hadoop_HDFS_API文件删除

430

131

5分2秒

52_尚硅谷_Hadoop_HDFS_API文件更名和移动

400

132

7分56秒

53_尚硅谷_Hadoop_HDFS_API文件详情查看

390

133

3分19秒

54_尚硅谷_Hadoop_HDFS_API文件和文件夹判断

440

134

11分36秒

55_尚硅谷_Hadoop_HDFS_写数据流程

510

135

4分29秒

56_尚硅谷_Hadoop_HDFS_节点距离计算

450

136

6分6秒

57_尚硅谷_Hadoop_HDFS_机架感知（副本存储节点选择）

330

137

5分3秒

58_尚硅谷_Hadoop_HDFS_读数据流程

370

138

13分27秒

59_尚硅谷_Hadoop_HDFS_NN和2NN工作机制

390

139

9分32秒

60_尚硅谷_Hadoop_HDFS_FsImage镜像文件

390

140

4分48秒

61_尚硅谷_Hadoop_HDFS_Edits编辑日志

350

141

2分33秒

62_尚硅谷_Hadoop_HDFS_检查点时间设置

410

142

7分35秒

63_尚硅谷_Hadoop_HDFS_DN工作机制

390

143

7分6秒

64_尚硅谷_Hadoop_HDFS_数据完整性

420

144

4分43秒

65_尚硅谷_Hadoop_HDFS_掉线时限参数设置

470

145

3分43秒

66_尚硅谷_Hadoop_HDFS_总结

380

146

4分22秒

67_尚硅谷_Hadoop_MapReduce_课程介绍

360

147

9分58秒

68_尚硅谷_Hadoop_MapReduce_概述&优点缺点

420

148

9分41秒

69_尚硅谷_Hadoop_MapReduce_核心思想

350

149

7分6秒

70_尚硅谷_Hadoop_MapReduce_官方WC源码&序列化类型

380

150

7分7秒

71_尚硅谷_Hadoop_MapReduce_编程规范

400

151

6分55秒

72_尚硅谷_Hadoop_MapReduce_WordCount案例需求分析

420

152

4分9秒

73_尚硅谷_Hadoop_MapReduce_WordCount案例环境准备

360

153

14分13秒

74_尚硅谷_Hadoop_MapReduce_WordCount案例Mapper

360

154

8分45秒

75_尚硅谷_Hadoop_MapReduce_WordCount案例Reducer

430

155

10分58秒

76_尚硅谷_Hadoop_MapReduce_WordCount案例Driver

470

156

15分20秒

77_尚硅谷_Hadoop_MapReduce_WordCount案例Debug调试

370

157

12分41秒

78_尚硅谷_Hadoop_MapReduce_WordCount案例集群运行

500

158

6分29秒

79_尚硅谷_Hadoop_MapReduce_序列化概述

380

159

8分18秒

80_尚硅谷_Hadoop_MapReduce_自定义序列化步骤

450

160

9分8秒

81_尚硅谷_Hadoop_MapReduce_序列化案例需求分析

410

161

6分50秒

82_尚硅谷_Hadoop_MapReduce_序列化案例FlowBean

420

162

8分59秒

83_尚硅谷_Hadoop_MapReduce_序列化案例FlowMapper

420

163

4分49秒

84_尚硅谷_Hadoop_MapReduce_序列化案例FlowReducer

450

164

6分20秒

85_尚硅谷_Hadoop_MapReduce_序列化案例FlowDriver

400

165

7分53秒

86_尚硅谷_Hadoop_MapReduce_序列化案例debug调试

350

166

15分18秒

87_尚硅谷_Hadoop_MapReduce_切片机制与MapTask并行度决定机制

360

167

20分33秒

88_尚硅谷_Hadoop_MapReduce_Job提交流程

320

168

19分16秒

89_尚硅谷_Hadoop_MapReduce_切片源码

380

169

4分59秒

90_尚硅谷_Hadoop_MapReduce_切片源码总结

530

170

3分13秒

91_尚硅谷_Hadoop_MapReduce_FileInputFormat切片机制

370

171

4分38秒

92_尚硅谷_Hadoop_MapReduce_TextInputFormat

430

172

10分17秒

93_尚硅谷_Hadoop_MapReduce_CombineTextInputFormat

320

173

16分42秒

94_尚硅谷_Hadoop_MapReduce_MapReduce工作流程

450

174

6分21秒

95_尚硅谷_Hadoop_MapReduce_Shuffle机制

390

175

12分49秒

96_尚硅谷_Hadoop_MapReduce_默认HashPartitioner分区

450

176

7分19秒

97_尚硅谷_Hadoop_MapReduce_自定义分区案例

370

177

7分19秒

98_尚硅谷_Hadoop_MapReduce_分区数与Reduce个数的总结

360

178

14分13秒

99_尚硅谷_Hadoop_MapReduce_排序概述

400

17_尚硅谷_Hadoop_入门_大数据技术生态体系

我来说两句

作者

相关推荐

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐