文章/答案/技术大牛

发布

首页视频02-尚硅谷-大数据技术之Hive-调优（课程介绍）

02-尚硅谷-大数据技术之Hive-调优（课程介绍）

2022-12-022022-12-02 16:02:20播放38

点赞0 收藏 0

2.尚硅谷大数据学科--核心框架/尚硅谷大数据技术之Hive 3.x高级进阶/视频/02-尚硅谷-大数据技术之Hive-调优（课程介绍）.mp4

原链接：http://www.atguigu.com/

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:00
好的同学们，嗯，那么接下来呢，我们就进入这个have整个优化的一个学习，那在生产环境当中，咱们整在对于have的优化呢，是非常重要的一块啊，呃，那么我们本次课程当中主要从哪些方面给大家去讲我们的优化呢？我们来看一下啊，但是在聊优化之前，我们首先明确一下我们目前来说使用的have版本。啊，那我们可以给大家看一下，我们的资料当中是3.1.2的版本，也就是说呃，有的同学可能用的是比较老的一个版本，呃，那在这种情况下来说呢，可能我们当前所聊的优化方案，你那边看到的效果可能不太一样啊，那是因为有版本。来导致的啊，所以一定要明确，我们现在用的是3.1.2，如有不同。
01:00
啊，那你一定要确定是否是版本的问题，一定要确定一下OK吧？好，那么接下来呢，我们就看一下在本次课程当中，我们主要需要给大家介绍什么内容，首先我们折叠一下，那么我们主要从这么几章给大家去做介绍，第一章。是查看执行计划。呃，那我们知道在。我们正常写的是一个hi口在have的客户端，对不对，但是真正运行的时候呢，默认它运行的是一个map reduce任务，呃，那么我们通过对于海口查看它的一个执行计划，了解一下map reduce它的一个执行过程，这是第一个点，第二个在生产环境当中，往往我们有时候呢，数据量是非常庞大的。如果说我们做了一个优化以后。需要用测试的方式来看一下当前的优化是否生效，那往往这个耗费的时间是非常多的，因为有时候我们数据量巨大，呃，运行一个色课可能就需要好几个小时。
02:10
那我们做了一点优化之后，我们就要运行一下，浪费几个小时不太合适，所以我们在做完优化以后，我们可以通过查看执行计划来了解到咱们的优化是否起到作用。啊，所以呢，我们把第一章只设置一个查看执行计划，它是一个非常重点的一个内容，在生产环境当中可以帮我们节约很多的时间，啊，这是第一个，第二个。接下来从第二章开始啊呃，到。最后一章我们都要从不同的角度来了解一下have写hi客的时候有哪些优化啊，那么第二章呢，是大的从DDL这个语句上面，我们从建标语句上面来看一下我们能不能做到优化，哎，当然是可以的，因为在have当中呢，是有分区表，分同表啊，那第三章呢，是骇客当中的一个优化，那么第三章我们将会涉及到非常多的优化手段。
03:16
啊呃，当然有一些比较常规，有一些呢，可能大家之前没有接触到，那在这个当中呢，我们给他摘出来总结在这块给大家，呃，第四章是生长环境当中老生常谈的一个。内容的一个优化叫数据倾斜，那我们就看一下在生产环境当中有哪些情况会导致我们的数据倾斜，以及数据倾斜和数据过量，它们之间又有什么区别？最后呢，我们就给大家介绍几种方法去解决我们的数据倾斜问题。呃，第五章是从job任务，整体任务的角度来聊一聊我们have当中的优化，第六章have on Spark的优化，因为我们知道。
04:00
我们have除了mi引擎，还有T子，还有这个Spark引擎，所以呢，在生产环境当中有一些公司呢，也是用Spark作为我们Hu的引擎的，所以最后一张呢，我们放了一个汉王SSPA当中一些挑优的参数，到时候我们可以带大家去过一下啊，但是呢，其实大家如果用的是汉王wag，应该知道氦王bug呢，其实bug还是比较多的啊呃，后面呢，我会给大家稍微的去提一提啊，大家也可以结合自己在生产环境当中看有没有遇到过类似的这种bug OK，这是我们当前整个have优化过程当中所涉及到的全部内容。

展开

我来说两句

0 条评论

登录后参与评论

作者

腾讯云开发者课程

【合辑】尚硅谷大数据技术之Hive 3.x高级进阶

（2/42）

5分42秒

01-尚硅谷-大数据技术之Hive-课程总体介绍

420

4分43秒

02-尚硅谷-大数据技术之Hive-调优（课程介绍）

380

10分29秒

03-尚硅谷-大数据技术之Hive-调优（执行计划）

400

6分36秒

04-尚硅谷-大数据技术之Hive-调优（建表优化分区表）

380

1分24秒

05-尚硅谷-大数据技术之Hive-调优（建表优化分桶表）

410

2分20秒

06-尚硅谷-大数据技术之Hive-调优（建表优化文件&压缩格式）

380

6分57秒

07-尚硅谷-大数据技术之Hive-调优（HQL优化单表查询优化1-5）

400

5分58秒

08-尚硅谷-大数据技术之Hive-调优（HQL优化多表查询优化6-7）

330

8分7秒

09-尚硅谷-大数据技术之Hive-调优（HQL优化多表查询优化8）

280

9分1秒

10-尚硅谷-大数据技术之Hive-调优（HQL优化多表查询优化9 大表JOIN大表）

420

52秒

11-尚硅谷-大数据技术之Hive-调优（HQL优化多表查询优化10 笛卡尔积）

350

7分18秒

12-尚硅谷-大数据技术之Hive-调优（单表数据倾斜）

320

1分17秒

13-尚硅谷-大数据技术之Hive-调优（多表数据倾斜）

360

4分33秒

14-尚硅谷-大数据技术之Hive-调优（Job优化 Map&Reduce）

340

6分30秒

15-尚硅谷-大数据技术之Hive-调优（Job优化其他方式）

350

3分43秒

16-尚硅谷-大数据技术之Hive-调优（Hive On Spark）

370

4分53秒

17-尚硅谷-大数据技术之Hive-源码-课程介绍

470

10分12秒

18-尚硅谷-大数据技术之Hive-源码-核心组件回顾&HQL翻译MR流程介绍

360

9分15秒

19-尚硅谷-大数据技术之Hive-源码-源码流程整体介绍

270

4分52秒

20-尚硅谷-大数据技术之Hive-源码-源码阅读（准备工作）

350

12分56秒

21-尚硅谷-大数据技术之Hive-源码-源码阅读（入口程序）

370

8分32秒

22-尚硅谷-大数据技术之Hive-源码-源码阅读（读取HQL语句分类解析）

280

4分42秒

23-尚硅谷-大数据技术之Hive-源码-源码阅读（控制台打印信息介绍）

400

7分46秒

24-尚硅谷-大数据技术之Hive-源码-源码阅读（进入编译HQL代码）

360

4分24秒

25-尚硅谷-大数据技术之Hive-源码-源码阅读（读取HQL语句小总结）

390

3分50秒

26-尚硅谷-大数据技术之Hive-源码-源码阅读（四大组件作用区域介绍）

300

8分1秒

27-尚硅谷-大数据技术之Hive-源码-源码阅读（解析器工作完成AST）

300

9分3秒

28-尚硅谷-大数据技术之Hive-源码-源码阅读（对AST加工源码流程）

320

5分49秒

28.尚硅谷_Hive-源码-源码阅读（对AST加工源码流程 1）

400

3分55秒

29-尚硅谷-大数据技术之Hive-源码-源码阅读（对AST加工小总结）

360

7分40秒

30-尚硅谷-大数据技术之Hive-源码-源码阅读（任务提交流程）

390

3分3秒

31-尚硅谷-大数据技术之Hive-源码-源码阅读（源码流程小总结）

380

13分11秒

32-尚硅谷-大数据技术之Hive-源码-源码阅读（Hive Debug模式）

400

4分33秒

33-尚硅谷-大数据技术之Hive-面试题（课程介绍）

380

15分12秒

34-尚硅谷-大数据技术之Hive-面试题（题1）

450

10分27秒

35-尚硅谷-大数据技术之Hive-面试题（题2 思路分析）

370

8分3秒

36-尚硅谷-大数据技术之Hive-面试题（题2 HQL实现）

350

8分33秒

37-尚硅谷-大数据技术之Hive-面试题（题3 思路一思路分析）

330

6分4秒

38-尚硅谷-大数据技术之Hive-面试题（题3 思路二思路分析）

360

13分18秒

39-尚硅谷-大数据技术之Hive-面试题（题4 思路分析）

400

3分51秒

40-尚硅谷-大数据技术之Hive-面试题（题4 HQL实现）

370

13分0秒

41-尚硅谷-大数据技术之Hive-面试题（题5 思路分析&HQL实现

460

02-尚硅谷-大数据技术之Hive-调优（课程介绍）

我来说两句

作者

相关推荐

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐