文章/答案/技术大牛

发布

首页视频44_ClickHouse高级_单表查询优化_使用uniqCombined

44_ClickHouse高级_单表查询优化_使用uniqCombined

2022-12-022022-12-02 16:02:17播放44

点赞0 收藏 0

2.尚硅谷大数据学科--核心框架/尚硅谷大数据技术之ClickHouse/视频/44_ClickHouse高级_单表查询优化_使用uniqCombined.mp4

原链接：http://www.atguigu.com/

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:00
那个叫什么来着，叫难上加难的。满身大汗。可以。Combine in distinct，大家知道咱们have经常最怕一个什么操作啊，哎，对，它默认是不是也走一个reduce啊，对吧，如果你是一张分区表，你不过滤分区又做了这个事，那数据量一大，它直接就崩了啊，OM了啊这那的。如果你是have Spark，是不是连Spark都被你干崩了？对吧。那那么在这里呢，首先我们来聊一聊这个东西。呃，克里卡house底层跑它用的是什么？它不是用count去跑的，它用的是另外一个函数，也是unique那个系列的一个函数，它叫精准去重来，我给大家看一眼，看一下它的一个执行优化语句啊，也是prime sys。
01:17
好，穿过来。就是这个U亏，这是不是抽取的意思啊。他会用这个来跑。那这个跟另外一个有什么区别呢？这个是近似去重近似，也就是说我不保证百分百的准确率，但是我快。当然不是说他只有50%啊，那谁敢用啊，那用跟没用一样啊，基本上你可以近似认为它比较靠谱，如果你要追求完全精确，效率无所谓，那你就。正常写就行了，它顶上反正用的是用那个是吧。
02:04
那我们来试一下效率呗，先来跑一个普通的count，精准去重。用了0.493秒，玉王虫剩886万口。那胖然，咱们是对谁去种啊雌激素吗？我我这张表是870万行啊啊多少条880万呢。那每一行是不是产生一个随机数啊，那么在这880万个随机数里边有886万啊，887元来对吧。好，那我们再来另一个看一下效率啊。这是近似驱虫数，数值不用关注了呗。那我再执行一遍是不是又不一样了，但你这样没法确定它到底准不准啊，对吧，那我来一个，我改一下U了ID，我不对这个随机数去重了，因为这个值你也不知道它准不准，我对URID去重可以吧？好，你看119862，那同样另一个count distinct，我也改一下U了ID，看它准不准了。
03:26
准吗？少了一点吧。少了一点，你不相信，然后再来一遍。这个再来一遍，你发现他就是这样子，这其实有点像什么呢？呃呃，对，有点像布隆，布隆大家在弗link的时候是不是介绍过，对吧，它是有一些误差率的。那么你想想，比如说你们要算一个UV。
04:02
那你觉得一定要非常精确嘛，假设你的UV是100万，然后你算出来是999987。跟九千九百九九九九这个，比如说这个是精确这个近似的，那么对于你而言，这个指标而言是不是无所谓啊。对吧，像这种场景你就求快就行了，但是如果你是金融类的指标，跟钱相关的，你是不是一分。都不能差呀，最好了，那你就只能精确精确。那其他场景大部分咱们可以用这个combine这种方式来做啊。

展开

我来说两句

0 条评论

登录后参与评论

作者

腾讯云开发者课程

【合辑】尚硅谷大数据技术之ClickHouse

（44/64）

13分13秒

01_ClickHouse总体_课程介绍

520

3分24秒

02_ClickHouse入门_课程介绍

510

24分51秒

03_ClickHouse入门_介绍&特点

490

18分36秒

04_ClickHouse入门_安装_准备工作

490

25分11秒

05_ClickHouse入门_安装_单机安装

440

21分38秒

06_ClickHouse入门_数据类型

470

14分16秒

07_ClickHouse入门_表引擎介绍

390

8分24秒

08_ClickHouse入门_MergeTree引擎_简单使用

370

33分24秒

09_ClickHouse入门_MergeTree引擎_分区详解

400

4分27秒

10_ClickHouse入门_MergeTree引擎_主键

370

6分10秒

11_ClickHouse入门_MergeTree引擎_Order by

420

12分6秒

12_ClickHouse入门_MergeTree引擎_二级索引

490

11分59秒

13_ClickHouse入门_MergeTree引擎_TTL

390

11分38秒

14_ClickHouse入门_ReplacingMergeTree引擎

490

10分21秒

15_ClickHouse入门_SummingMergeTree引擎

400

5分19秒

16_ClickHouse入门_开发中引擎的选择

410

14分6秒

17_ClickHouse入门_SQL操作_Update和Delete

380

11分1秒

18_ClickHouse入门_SQL操作_查询和函数介绍

450

13分31秒

19_ClickHouse入门_SQL操作_多维分析函数

400

4分43秒

20_ClickHouse入门_SQL操作_alter&导出

490

18分38秒

21_ClickHouse入门_副本引擎

370

16分32秒

22_ClickHouse入门_分片集群介绍

350

21分52秒

23_ClickHouse入门_分片集群实操

510

3分56秒

24_ClickHouse高级_课程简介

470

8分29秒

25_ClickHouse高级_新版本安装&.官网在线demo介绍

450

8分23秒

26_ClickHouse高级_执行计划_plan&AST

360

5分45秒

27_ClickHouse高级_执行计划_syntax&pipeline

430

4分19秒

28_ClickHouse高级_执行计划_老版本如何查看

300

8分49秒

29_ClickHouse高级_建表优化_注意数据类型

410

6分27秒

30_ClickHouse高级_建表优化_分区和索引

350

8分59秒

31_ClickHouse高级_表参数&写入和删除优化

430

24分19秒

32_ClickHouse高级_CPU参数设置

360

6分7秒

33_ClickHouse高级_内存参数设置

470

2分48秒

34_ClickHouse高级_存储优化

400

10分40秒

35_ClickHouse高级_语法优化规则_准备测试用表

340

4分36秒

36_ClickHouse高级_语法优化规则_count优化

420

9分55秒

37_ClickHouse高级_语法优化规则_子查询重复字段&谓词下推

290

5分53秒

38_ClickHouse高级_语法优化规则_聚合计算外推&聚合函数消除

320

4分55秒

39_ClickHouse高级_语法优化规则_删除重复字段(不同语法下)

490

6分1秒

40_ClickHouse高级_语法优化规则_标量替换&三元运算优化

370

15分32秒

41_ClickHouse高级_单表查询优化_prewhere&采样

370

7分49秒

42_ClickHouse高级_单表查询优化_数据裁剪&Orderby用法

490

5分4秒

43_ClickHouse高级_单表查询优化_避免构建虚拟列

500

4分48秒

44_ClickHouse高级_单表查询优化_使用uniqCombined

440

9分7秒

45_ClickHouse高级_单表查询优化_使用物化视图&其他事项

410

6分55秒

46_ClickHouse高级_多表关联_使用IN代替JOIN

470

4分8秒

47_ClickHouse高级_多表关联_大小表JOIN

450

6分27秒

48_ClickHouse高级_多表关联_谓词下推

420

11分36秒

49_ClickHouse高级_多表关联_字典表&其他

420

8分4秒

50_ClickHouse高级_数据一致性_数据准备

430

2分4秒

51_ClickHouse高级_数据一致性_手动执行

400

9分58秒

52_ClickHouse高级_数据一致性_通过Group by去重

340

14分26秒

53_ClickHouse高级_数据一致性_使用Final&总结

770

8分17秒

54_ClickHouse高级_物化视图_概述

390

9分24秒

55_ClickHouse高级_物化视图_实操

340

8分16秒

56_ClickHouse高级_MaterializeMySQL引擎_概述

330

17分17秒

57_ClickHouse高级_MaterializeMySQL引擎_实操

380

17分6秒

58_ClickHouse高级_常见问题排查

350

4分21秒

59_ClickHouse监控_概述

370

11分44秒

60_ClickHouse监控_Prometheus&Grafana安装

430

3分8秒

61_ClickHouse监控_ClickHouse配置

470

15分55秒

62_ClickHouse监控_配置监控实现

400

26分48秒

63_ClickHouse备份_手动实现备份及恢复

460

22分36秒

64_ClickHouse备份_使用clickhouse-backup

550

44_ClickHouse高级_单表查询优化_使用uniqCombined

我来说两句

作者

相关推荐

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐