文章/答案/技术大牛

发布

首页视频42_ClickHouse高级_单表查询优化_数据裁剪&Orderby用法

42_ClickHouse高级_单表查询优化_数据裁剪&Orderby用法

2022-12-022022-12-02 16:02:17播放49

点赞0 收藏 0

2.尚硅谷大数据学科--核心框架/尚硅谷大数据技术之ClickHouse/视频/42_ClickHouse高级_单表查询优化_数据裁剪&Orderby用法.mp4

原链接：http://www.atguigu.com/

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:00
还有一个来，往下走，把这去掉，呃，列裁剪与分区裁剪，什么叫裂裁剪呢？咱们存的都是宽表啊，你不要来个这儿啊。你觉得合适吗？啊，我来给你们试一下啊。我现在在这个库下面对吧，那我就不带库名了，来回车。我呢？他一会儿就挂了，就说什么超出那个大小。让他慢慢跑吧。你觉得这样合适吗？100多个字段呢，一行啊，180个字段啊，这张表130个字段啊，天呐，不要这么玩啊。不要像太晚不要轻易尝试啊，但如果你你觉得官网你想试一下它是吧。我们我也来试一下吧，我省得他报，省得他报错，我先写个户名啊。
01:06
啊，过了好几秒了。好多秒了。好了，我感觉。天呐天呐，不要这么玩啊，同学们。他不是查询慢，它是打印出来慢，你知道吗？它是打印的慢，不是查询慢，你看。人家出来了，但他你看拉过来这么多个字段呢。他至少出来了对吧，这是克里卡house的一个优秀的地方，他查询很快，但是你不要在这打印，你看扫力好，这是一个啊裂裁剪，那如果另一种叫什么分区裁剪什么意思啊，能够提前过滤就过滤，咱们hi普经常怎么用啊，避免分全表扫描，那是不是见的分区表，那咱们写搜索是不是经常为了分区，是为多少对吧？啊通过这种方式啊，那么目前咱们学呢，咱们是可以pre位啊对吧，然后分区怎么样怎么样，这么难用。
02:24
哎呀。查询几个字段来吧，我们在官网跑吧，刚才明显跑很久对吧，你不可能宽表所有字段你都要的，比如说你现在业务上查出来，你要查这几个字段十来个，还是这张表it。好执行，你看效率有没有高一点。是不是快多了，明显，当然他这个官网好像没有那个时长统计啊，哎呀，拉不动了哦不是。它就是不显示啊。不显示就比较恶心了，我拉到最下面。
03:02
它不显示完全，它应该是只显示这么多条。8000多条。这这完完事没有完了还没完事。插电我怕崩了呀，我试过大概是在五分钟到十分钟左右就。就报错了，然后重连肯格。过滤条件很简单对吧，加一个过滤条件，这个我们也跑一下，哎，这个even today。是不是的字段不是是的吧。那如果不确定，咱们来瞅一眼它的什么呢？呃，电表语句嘛，记呃，这里这里这里，我用记事本打开往下拉，直接拉到最后面爬升败，看到没有even的，对，就通常这么来用啊，也是商场上比较推荐的一个方法，那既然控制台不行，那我就跑这儿。
04:11
把它粘过来。是不是也快多了，就是从不同层层级去感受一下哈，快多了。乱七八糟。好，这个没啥好讲的，那我们再讲一个注意事项，Order by。不要单独使用派，是不是也一样的派，如果你单独用order，是不是会进入到一个reducer全局排序，可能内存就爆了对吧？呃。嗯，那咱们其实你对一个数据排序通常是不需要直接输出的。你你要对数据结果排序一一般是取前几个，也就拓N问题，那这个时候你可以依赖于limit米是吧派是不是order by，你要用你就结合limit，用严格模式也可以限制它，对吧？啊那咱们同样的对千万以上的数据集进行order advice。
05:15
搭配我也跟利一起使用，对吧？来咱们瞅一眼，嗯，跑一下看一下，哎呀看不了了。我。我再开一个。我这都卡死了。哎呀，点不了。关键是你，你还不让我停，你打吧，不管你了，我可痛了，哎呀，我进来了，哎。其实他早就查完了，一直在打印打印打印，烦死了。好，我们先看一下，这边有时间统计。他少了处理了多少条数据啊，8000多条吧，为啥，因为咱们是不是分列了一下对吧，数据集是不是减少了，好，那我们再来看另外一个。
06:17
这里我就不加V，也不加厘米的。处理了多少，虽然它很快，但你要看他处理的数据量，因为我这个搜狗语句比较简单嘛，啊这里是多少8000万啊八啊对800万啊，也就是全，他是不是进行了全表扫描啊，对吧，没毛病，那如果加个limit米呢，有用吗？我们看它扫描多少，比如说limit米1000。没有用，Limit是不是最后才过滤啊，但是速度是不是快一点，你看啊。
07:00
这个0.8秒，他利米特呢，0.028秒，它底层也是做了处理的，它并不会一下子全部处理一遍啊。那我们单独V尔就不用单独测了吧，VR是不是肯定会过滤掉数据啊，但至少咱们现在也测出来，单独结合低米特效率明显的有一个质的提升嘛，前面是多少0.8吧，我记得0.8跟零点零二十倍了。对吧，所以跟注意点一样的，那如果你两个一起用，那是不是锦上添花对吧。上上天。

展开

我来说两句

0 条评论

登录后参与评论

作者

腾讯云开发者课程

【合辑】尚硅谷大数据技术之ClickHouse

（42/64）

13分13秒

01_ClickHouse总体_课程介绍

520

3分24秒

02_ClickHouse入门_课程介绍

510

24分51秒

03_ClickHouse入门_介绍&特点

490

18分36秒

04_ClickHouse入门_安装_准备工作

490

25分11秒

05_ClickHouse入门_安装_单机安装

440

21分38秒

06_ClickHouse入门_数据类型

470

14分16秒

07_ClickHouse入门_表引擎介绍

390

8分24秒

08_ClickHouse入门_MergeTree引擎_简单使用

370

33分24秒

09_ClickHouse入门_MergeTree引擎_分区详解

400

4分27秒

10_ClickHouse入门_MergeTree引擎_主键

370

6分10秒

11_ClickHouse入门_MergeTree引擎_Order by

420

12分6秒

12_ClickHouse入门_MergeTree引擎_二级索引

490

11分59秒

13_ClickHouse入门_MergeTree引擎_TTL

390

11分38秒

14_ClickHouse入门_ReplacingMergeTree引擎

490

10分21秒

15_ClickHouse入门_SummingMergeTree引擎

400

5分19秒

16_ClickHouse入门_开发中引擎的选择

410

14分6秒

17_ClickHouse入门_SQL操作_Update和Delete

380

11分1秒

18_ClickHouse入门_SQL操作_查询和函数介绍

450

13分31秒

19_ClickHouse入门_SQL操作_多维分析函数

400

4分43秒

20_ClickHouse入门_SQL操作_alter&导出

490

18分38秒

21_ClickHouse入门_副本引擎

370

16分32秒

22_ClickHouse入门_分片集群介绍

350

21分52秒

23_ClickHouse入门_分片集群实操

510

3分56秒

24_ClickHouse高级_课程简介

470

8分29秒

25_ClickHouse高级_新版本安装&.官网在线demo介绍

450

8分23秒

26_ClickHouse高级_执行计划_plan&AST

360

5分45秒

27_ClickHouse高级_执行计划_syntax&pipeline

430

4分19秒

28_ClickHouse高级_执行计划_老版本如何查看

300

8分49秒

29_ClickHouse高级_建表优化_注意数据类型

410

6分27秒

30_ClickHouse高级_建表优化_分区和索引

350

8分59秒

31_ClickHouse高级_表参数&写入和删除优化

430

24分19秒

32_ClickHouse高级_CPU参数设置

360

6分7秒

33_ClickHouse高级_内存参数设置

470

2分48秒

34_ClickHouse高级_存储优化

400

10分40秒

35_ClickHouse高级_语法优化规则_准备测试用表

340

4分36秒

36_ClickHouse高级_语法优化规则_count优化

420

9分55秒

37_ClickHouse高级_语法优化规则_子查询重复字段&谓词下推

290

5分53秒

38_ClickHouse高级_语法优化规则_聚合计算外推&聚合函数消除

320

4分55秒

39_ClickHouse高级_语法优化规则_删除重复字段(不同语法下)

490

6分1秒

40_ClickHouse高级_语法优化规则_标量替换&三元运算优化

370

15分32秒

41_ClickHouse高级_单表查询优化_prewhere&采样

370

7分49秒

42_ClickHouse高级_单表查询优化_数据裁剪&Orderby用法

490

5分4秒

43_ClickHouse高级_单表查询优化_避免构建虚拟列

500

4分48秒

44_ClickHouse高级_单表查询优化_使用uniqCombined

440

9分7秒

45_ClickHouse高级_单表查询优化_使用物化视图&其他事项

410

6分55秒

46_ClickHouse高级_多表关联_使用IN代替JOIN

470

4分8秒

47_ClickHouse高级_多表关联_大小表JOIN

450

6分27秒

48_ClickHouse高级_多表关联_谓词下推

420

11分36秒

49_ClickHouse高级_多表关联_字典表&其他

420

8分4秒

50_ClickHouse高级_数据一致性_数据准备

430

2分4秒

51_ClickHouse高级_数据一致性_手动执行

400

9分58秒

52_ClickHouse高级_数据一致性_通过Group by去重

340

14分26秒

53_ClickHouse高级_数据一致性_使用Final&总结

770

8分17秒

54_ClickHouse高级_物化视图_概述

390

9分24秒

55_ClickHouse高级_物化视图_实操

340

8分16秒

56_ClickHouse高级_MaterializeMySQL引擎_概述

330

17分17秒

57_ClickHouse高级_MaterializeMySQL引擎_实操

380

17分6秒

58_ClickHouse高级_常见问题排查

350

4分21秒

59_ClickHouse监控_概述

370

11分44秒

60_ClickHouse监控_Prometheus&Grafana安装

430

3分8秒

61_ClickHouse监控_ClickHouse配置

470

15分55秒

62_ClickHouse监控_配置监控实现

400

26分48秒

63_ClickHouse备份_手动实现备份及恢复

460

22分36秒

64_ClickHouse备份_使用clickhouse-backup

550

42_ClickHouse高级_单表查询优化_数据裁剪&Orderby用法

我来说两句

作者

相关推荐

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐