文章/答案/技术大牛

发布

首页视频45_尚硅谷_Hive查询_GroupBy & Having.avi

45_尚硅谷_Hive查询_GroupBy & Having.avi原创

2023-01-072023-01-07 00:35:12播放347

点赞0 收藏 0

尚硅谷大数据学科全套教程（总185.88GB）/尚硅谷大数学科--选学技术丰富/尚硅谷大数据之Hive视频/4.视频.zip/4.视频/45_尚硅谷_Hive查询_GroupBy & Having.avi

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:00
好，接下来我们看一下这个分子，其实这有这个格BY对吧，BY这个函数，一个组函数，它要跟这个聚合函数连起来在一块用啊，而且你查询字段里边如果没有用聚合函数。那就必须要放到哪啊工里边吧，是不是啊，好，那看一下他要查什么，查说查每个部门的一个平均工资，是每个部门的平均工资了，刚才是所有人的平均工资了，那select，呃，Avg，然后是cell，然后我们给它取个名字avg cell，然后是from，然后AP这张表，P这表，然后不要这个没有不要了，不用有什么过滤了，拜，Go，它是按部门来的吧，那就是第PT number了，第p number走一下。
01:10
那这个用MR写还是好写的吧，是吧，你K的位置放这个部门编号，然后具体的Y6，因为它查询的就这一个内容。那你就放cell，然后到了reduce阶段，是不是取出来一个搞一个那个什么抗的计数啊，计数之后把它累加，累加之后除以数，然后最终写出去就OK了呀，对吧，这三个部门的编号，我们应该刚才把那个部门编号放进去是吧？部门编号放进去了啊，这是三个部门的一个平均薪水啊，这种购入费，然后接下来还有他说计算每个部门当中每个岗位的一个最高薪水。每个岗位的一个最高薪水，那其实就是在刚才的基础上加了一个什么，那我们把这个他说每个部门像de。
02:04
Number我们加进去，然后还有一个叫我吧啊，它的一个岗位，OK，加进去，到时候好看一点是吧，然后这个地方就是grow by里边啊grow by里面我们所说的这只要你涉及到查询字段，它不带什么。聚合函数的话，那你就要放到里边了，里边了group，然后先是有部门嘛，他说每个部门叫不同岗位的平均工资吧，那就是部门的钱是吧，第pd number，然后是叫叫走一下。那像这种怎么做，这个需MR怎么写呢？主要想K吧，你就Y6还是一样吗？是不是Y6还是一样的，这个K就是一个自定义的K了吧，就是哎，首先是第1p number，然后是这个吧，是自定义的一个Java b对吧，Java b对象，然后那个要写它的一个比较方法，然后先按部门根号比，然后再按交薄比了啊这要这要做到，这是这个需求也比较简单，就是两个两个组嘛，分两个组。
03:33
好，那我们要求这个每个部门，刚才我们看到了他的每个部门的薪水油耗率低，我现在要查部门那个平均薪水大于有有我看一下啊，大于2000的，那怎么查呢。大于2000的，那首先还是这样，我既然要查部门的一个平均薪水的话，Select DEP number这个东西有啊，然后还有一个avg，然后salary，这个要有的，然后我们取个名字吧，IG Excel，然后来自于哪张表啊，你要告诉吧，好，Fromp这张表接下来怎么写呢？BY还要有啊，这个是一样的，GR up go by是这个d p number dp number这样正常的求出来是所有的部门都会出来啊，但是现在我们要求的是平均薪水啊，大于对，要用到heavy嘛，那这个时候will不行吧，Will它不能这种组函数求的。
04:53
结果它不能放到will里面吗？哎，所以要用heavy heavy直接用别名是可以的吧，用别名heavy这个大于2000的，那此时我们查出来数据应该就是两条吧，两条就是最后一个部门，三号部门应该就没了是吧，他就1000多走一下。
05:13
那就其实最终输出的时候做了一个限定是吧，做了一个判断，在你context点出这个方法之前，你有一个判断嘛，判断最终的个结果，平均薪水是否大于2000，如果说大于2000的话，你在执行那个写出，如果不大于2000的话，直接re return吧，直接return，那这样就是一号，就十号部门跟20号部门吧，30号部门就被关滤掉了，我个这主要就是heavyway，其实就是heavyway和V的一个区别，这两个不同，一个里边可以跟着一个组函数计算结果，一个是不能的。一个人不能的，如果你要想非得想用VI做这个需求的话，你要怎么办啊？我现在规定不准用happy，必须用well，那怎么做？再签一个是吧，做一个把这个当成子查询是吧，子查询就可以了。
06:09
啊，这是我们所讲的这个go和heavy啊，你要主要掌掌握它的一个不同点，不同点就是分组函数这块，分组函数一个可以一个后面不可以分组函数的，然后这就是具体的案例，具体的案例刚才我们也说过了。

展开

我来说两句

0 条评论

登录后参与评论

作者

腾讯云开发者课程

【合辑】尚硅谷大数据之Hive视频/4.视频.zip/4.视频

（49/103）

3分37秒

01_尚硅谷_Hive入门_课程介绍.avi

3220

16分38秒

02_尚硅谷_Hive入门_是什么.avi

3760

7分51秒

03_尚硅谷_Hive入门_优缺点.avi

3531

8分24秒

04_尚硅谷_Hive入门_架构.avi

3450

9分7秒

05_尚硅谷_Hive入门_与数据库比较.avi

3570

21分10秒

06_尚硅谷_Hive安装_安装与配置.avi

3710

6分41秒

07_尚硅谷_Hive安装_启动.avi

3500

8分16秒

08_尚硅谷_Hive安装_加载本地数据到Hive表.avi

3610

16分57秒

09_尚硅谷_Hive安装_MySQL服务.avi

3600

5分20秒

100_尚硅谷_谷粒影音_需求（五）.avi

3500

12分3秒

101_尚硅谷_谷粒影音_需求（六）.avi

3440

3分55秒

102_尚硅谷_谷粒影音_需求（七）.avi

3470

10分31秒

103_尚硅谷_Hive_总结.avi

3750

4分46秒

10_尚硅谷_Hive安装_配置MySQL无主机登录.avi

3430

8分55秒

11_尚硅谷_Hive安装_配置MetaStore到MySQL.avi

3570

12分44秒

12_尚硅谷_Hive安装_中常用的交互命令.avi

3640

4分6秒

13_尚硅谷_Hive安装_其他操作命令.avi

3670

11分22秒

14_尚硅谷_Hive安装_常见属性配置.avi

3750

4分19秒

15_尚硅谷_Hive安装_参数配置方式.avi

3400

3分24秒

16_尚硅谷_Hive安装_基本数据类型.avi

3680

15分29秒

17_尚硅谷_Hive安装_复杂数据类型.avi

3670

2分59秒

18_尚硅谷_Hive安装_类型转化.avi

3690

6分6秒

19_尚硅谷_Hive数据定义_创建数据库.avi

3650

6分26秒

20_尚硅谷_Hive数据定义_数据库查询.avi

3600

2分56秒

21_尚硅谷_Hive数据定义_数据库修改.avi

3690

2分16秒

22_尚硅谷_Hive数据定义_数据库删除.avi

3460

12分21秒

23_尚硅谷_Hive数据定义_创建表的语法.avi

3640

21分11秒

24_尚硅谷_Hive数据定义_回顾.avi

3740

6分22秒

25_尚硅谷_Hive数据定义_HiveServer2.avi

3490

10分57秒

26_尚硅谷_Hive数据定义_内部表.avi

3810

9分46秒

27_尚硅谷_Hive数据定义_外部表.avi

3770

7分29秒

28_尚硅谷_Hive数据定义_内外部表转换.avi

3390

18分19秒

29_尚硅谷_Hive数据定义_分区表基本操作.avi

3660

6分16秒

30_尚硅谷_Hive数据定义_二级分区.avi

3320

9分0秒

31_尚硅谷_Hive数据定义_分区表与数据关联的三种方式.avi

3740

10分10秒

32_尚硅谷_Hive数据定义_修改表.avi

3660

8分57秒

33_尚硅谷_Hive数据操作_Load方式加载数据.avi

3540

6分26秒

34_尚硅谷_Hive数据操作_Insert方式加载数据.avi

3790

5分59秒

35_尚硅谷_Hive数据操作_Location方式加载数据.avi

3660

3分32秒

36_尚硅谷_Hive数据操作_Import方式导入数据失败.avi

3430

6分47秒

37_尚硅谷_Hive数据操作_Insert导出数据.avi

3530

5分12秒

38_尚硅谷_Hive数据操作_导出数据的其他方式&Import导入数据成功.avi

3560

2分32秒

39_尚硅谷_Hive数据操作_清空表数据.avi

3540

5分18秒

40_尚硅谷_Hive数据操作_元数据信息.avi

3540

7分4秒

41_尚硅谷_Hive查询_基本查询.avi

3390

5分27秒

42_尚硅谷_Hive查询_常用的基本函数.avi

3780

9分56秒

43_尚硅谷_Hive查询_Where子句查询.avi

3550

3分11秒

44_尚硅谷_Hive查询_逻辑运算符.avi

3700

6分29秒

45_尚硅谷_Hive查询_GroupBy & Having.avi

3470

14分37秒

46_尚硅谷_Hive查询_Join操作.avi

3590

25分30秒

47_尚硅谷_Hive查询_回顾（一）.avi

3380

12分32秒

48_尚硅谷_Hive查询_回顾（二）.avi

3320

4分43秒

49_尚硅谷_Hive排序_OrderBy.avi

3570

10分38秒

50_尚硅谷_Hive排序_SortBy.avi

3690

10分34秒

51_尚硅谷_Hive排序_DistributeBy.avi

3800

7分22秒

52_尚硅谷_Hive排序_ClusterBy.avi

3580

9分16秒

53_尚硅谷_Hive排序_总结.avi

3430

16分28秒

54_尚硅谷_Hive分桶_表创建.avi

3480

9分17秒

55_尚硅谷_Hive分桶_抽样查询.avi

3330

5分9秒

56_尚硅谷_Hive高级_给NULL赋值.avi

3730

12分14秒

57_尚硅谷_Hive高级_CaseWhen.avi

3490

25分27秒

58_尚硅谷_Hive高级_行转列.avi

3420

12分21秒

59_尚硅谷_Hive高级_列转行.avi

3660

16分2秒

60_尚硅谷_Hive高级_窗口函数需求（一）.avi

3670

10分40秒

61_尚硅谷_Hive高级_窗口函数需求（二）.avi

3520

17分12秒

62_尚硅谷_Hive高级_窗口函数需求（三）.avi

3570

10分43秒

63_尚硅谷_Hive高级_窗口函数需求（四）.avi

3550

7分58秒

64_尚硅谷_Hive高级_窗口函数需求（五）.avi

3540

23分15秒

65_尚硅谷_Hive高级_回顾.avi

3440

16分28秒

66_尚硅谷_Hive高级_窗口函数回顾.avi

3410

15分23秒

67_尚硅谷_Hive高级_Rank.avi

3440

8分3秒

68_尚硅谷_Hive高级_函数介绍.avi

3620

6分35秒

69_尚硅谷_Hive高级_自定义函数.avi

3300

21分28秒

70_尚硅谷_Hive高级_压缩.avi

3470

11分53秒

71_尚硅谷_Hive高级_存储格式介绍.avi

3590

12分21秒

72_尚硅谷_Hive高级_存储格式比较.avi

3600

5分24秒

73_尚硅谷_Hive高级_存储与压缩结合.avi

3520

3分48秒

74_尚硅谷_Hive优化_Fetch抓取.avi

3730

2分16秒

75_尚硅谷_Hive优化_本地模式.avi

3220

9分45秒

76_尚硅谷_Hive优化_小表Join大表.avi

3720

14分2秒

77_尚硅谷_Hive优化_空key处理.avi

3460

4分16秒

78_尚硅谷_Hive优化_MapJoin.avi

3610

6分27秒

79_尚硅谷_Hive优化_GroupBy.avi

3510

8分13秒

80_尚硅谷_Hive优化_去重统计.avi

3770

7分57秒

81_尚硅谷_Hive优化_行列过滤.avi

3640

19分20秒

82_尚硅谷_Hive优化_动态分区.avi

3450

34分2秒

83_尚硅谷_Hive优化_回顾.avi

3570

11分39秒

84_尚硅谷_Hive优化_数据倾斜.avi

3470

2分55秒

85_尚硅谷_Hive优化_并行执行.avi

3770

7分33秒

86_尚硅谷_Hive优化_严格模式.avi

3210

2分30秒

87_尚硅谷_Hive优化_JVM重用.avi

3710

2分48秒

88_尚硅谷_Hive优化_推测执行&压缩.avi

3420

3分0秒

89_尚硅谷_Hive优化_Explain.avi

3660

11分40秒

90_尚硅谷_谷粒影音_需求分析.avi

3440

6分44秒

91_尚硅谷_谷粒影音_Mapper.avi

3450

17分53秒

92_尚硅谷_谷粒影音_ETLUtil.avi

3620

11分17秒

93_尚硅谷_谷粒影音_Driver.avi

3560

5分22秒

94_尚硅谷_谷粒影音_清洗数据.avi

3370

8分48秒

95_尚硅谷_谷粒影音_建表&导入数据.avi

3670

100

9分0秒

96_尚硅谷_谷粒影音_需求（一）.avi

3840

101

9分17秒

97_尚硅谷_谷粒影音_需求（二）.avi

3470

102

16分36秒

98_尚硅谷_谷粒影音_需求（三）.avi

3640

103

21分33秒

99_尚硅谷_谷粒影音_需求（四）.avi

3740

45_尚硅谷_Hive查询_GroupBy & Having.avi原创

我来说两句

作者

相关推荐

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐