文章/答案/技术大牛

发布

首页视频47_ClickHouse高级_多表关联_大小表JOIN

47_ClickHouse高级_多表关联_大小表JOIN

2022-12-022022-12-02 16:02:17播放45

点赞0 收藏 0

2.尚硅谷大数据学科--核心框架/尚硅谷大数据技术之ClickHouse/视频/47_ClickHouse高级_多表关联_大小表JOIN.mp4

原链接：http://www.atguigu.com/

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:00
好，那我们接下来看一个大小表交易，Have是不是也有一个大小表交易呢？优化在早期版本，咱们是不是必须把小表写在。左边吧，对吧，小表驱动大表嘛，买so也一样啊，但是hi在高版本是不是那个CPU帮我们自动优化的，你写左写右它都自动。能够把小表加载到内存是吧，它能识别到，呃，那咱们肯定有耗子不一样啊，它是什么？其实从我前面介绍的原理大家也能想到了呗，它就用的时候怎么做的呀，把右边的表加载到内存是吧，我管你大还是小，我就是这么实现的。所以你觉得咱们小表应该写哪右边对吧，你非要join，你就得让尽量让右边的数据量小一点，来我们来试试呗，刚才大小表都建好了呗，小表是不是有一条有一个visit VR是不是1万条啊，够小了吧，相比他们100多万800多万啊，那么来试一下，许在右肯定是能跑出来的，我们看一下执行的时长。
01:13
啊，一单上去就带跑了，速度不算快，但至少能跑。你看每秒钟处理这么多啊。还是蛮快的啊。其实可卡耗快一个最重要的原因是什么？我觉得啊，数据在本地，你是不是只要IO能达到，基本上效率就差不了。MR的话是不是得跨节点跨网络传输啊，那很多时候带宽就是你的瓶颈，好，我们看一下跑完了26秒。对吧，那我们再来试试把把什么右边我写的是大表啊，跟上面这两个的区别在于这儿。
02:05
现在是把他们交换了一下位置啊。看得明白吧，好，He v1是800多万行的一张表，那另一张是1万行的表，前面已经跑过了，我们再跑一下另一个大表占右啊，如果我没记错的话，应该是跑不了内存超限制。好了，跑完了吗？并没有你以为跑完了想太多。啊对，看到这个了吧，然后报的什么错呢，然后一堆一堆对吧，这个。内容内存超过限制啊，他说想要使用3.32GB。这个是哪来的，这是我我虚拟机一共才四个G啊。当然你可以尝试给大看能不能跑出来，为什么会超限呢？同样两张表，我换个位置，一个能跑一个就不行了。还是咱们讲的原理，它是把右表加载到内存，那他一下子要把880多万条数据加载到内存，它就顶不住了啊，他就顶不住了，这个就很明显了。
03:21
嗯。如果你们配置配置够大。说哎，我能跑啊，没影响啊，那那你看看时间，肯定时间要比原来的长，对吧，这就特别明显了啊，记住啊，大小表就用小表在右，小表在右啊右啊跟亥普相反，亥普是在左。你看永远是拿着右表中的每一条记录，也就是加载到内存里边每一条，去左表里面找找记录能不能匹配上啊，这是它的一个基本执行方式啊。
04:05
这要特别注意啊。

展开

我来说两句

0 条评论

登录后参与评论

作者

腾讯云开发者课程

【合辑】尚硅谷大数据技术之ClickHouse

（47/64）

13分13秒

01_ClickHouse总体_课程介绍

520

3分24秒

02_ClickHouse入门_课程介绍

510

24分51秒

03_ClickHouse入门_介绍&特点

490

18分36秒

04_ClickHouse入门_安装_准备工作

490

25分11秒

05_ClickHouse入门_安装_单机安装

440

21分38秒

06_ClickHouse入门_数据类型

470

14分16秒

07_ClickHouse入门_表引擎介绍

390

8分24秒

08_ClickHouse入门_MergeTree引擎_简单使用

370

33分24秒

09_ClickHouse入门_MergeTree引擎_分区详解

400

4分27秒

10_ClickHouse入门_MergeTree引擎_主键

370

6分10秒

11_ClickHouse入门_MergeTree引擎_Order by

420

12分6秒

12_ClickHouse入门_MergeTree引擎_二级索引

490

11分59秒

13_ClickHouse入门_MergeTree引擎_TTL

390

11分38秒

14_ClickHouse入门_ReplacingMergeTree引擎

490

10分21秒

15_ClickHouse入门_SummingMergeTree引擎

400

5分19秒

16_ClickHouse入门_开发中引擎的选择

410

14分6秒

17_ClickHouse入门_SQL操作_Update和Delete

380

11分1秒

18_ClickHouse入门_SQL操作_查询和函数介绍

450

13分31秒

19_ClickHouse入门_SQL操作_多维分析函数

400

4分43秒

20_ClickHouse入门_SQL操作_alter&导出

490

18分38秒

21_ClickHouse入门_副本引擎

370

16分32秒

22_ClickHouse入门_分片集群介绍

350

21分52秒

23_ClickHouse入门_分片集群实操

510

3分56秒

24_ClickHouse高级_课程简介

470

8分29秒

25_ClickHouse高级_新版本安装&.官网在线demo介绍

450

8分23秒

26_ClickHouse高级_执行计划_plan&AST

360

5分45秒

27_ClickHouse高级_执行计划_syntax&pipeline

430

4分19秒

28_ClickHouse高级_执行计划_老版本如何查看

300

8分49秒

29_ClickHouse高级_建表优化_注意数据类型

410

6分27秒

30_ClickHouse高级_建表优化_分区和索引

350

8分59秒

31_ClickHouse高级_表参数&写入和删除优化

430

24分19秒

32_ClickHouse高级_CPU参数设置

360

6分7秒

33_ClickHouse高级_内存参数设置

470

2分48秒

34_ClickHouse高级_存储优化

400

10分40秒

35_ClickHouse高级_语法优化规则_准备测试用表

340

4分36秒

36_ClickHouse高级_语法优化规则_count优化

420

9分55秒

37_ClickHouse高级_语法优化规则_子查询重复字段&谓词下推

290

5分53秒

38_ClickHouse高级_语法优化规则_聚合计算外推&聚合函数消除

320

4分55秒

39_ClickHouse高级_语法优化规则_删除重复字段(不同语法下)

490

6分1秒

40_ClickHouse高级_语法优化规则_标量替换&三元运算优化

370

15分32秒

41_ClickHouse高级_单表查询优化_prewhere&采样

370

7分49秒

42_ClickHouse高级_单表查询优化_数据裁剪&Orderby用法

490

5分4秒

43_ClickHouse高级_单表查询优化_避免构建虚拟列

500

4分48秒

44_ClickHouse高级_单表查询优化_使用uniqCombined

440

9分7秒

45_ClickHouse高级_单表查询优化_使用物化视图&其他事项

410

6分55秒

46_ClickHouse高级_多表关联_使用IN代替JOIN

470

4分8秒

47_ClickHouse高级_多表关联_大小表JOIN

450

6分27秒

48_ClickHouse高级_多表关联_谓词下推

420

11分36秒

49_ClickHouse高级_多表关联_字典表&其他

420

8分4秒

50_ClickHouse高级_数据一致性_数据准备

430

2分4秒

51_ClickHouse高级_数据一致性_手动执行

400

9分58秒

52_ClickHouse高级_数据一致性_通过Group by去重

340

14分26秒

53_ClickHouse高级_数据一致性_使用Final&总结

770

8分17秒

54_ClickHouse高级_物化视图_概述

390

9分24秒

55_ClickHouse高级_物化视图_实操

340

8分16秒

56_ClickHouse高级_MaterializeMySQL引擎_概述

330

17分17秒

57_ClickHouse高级_MaterializeMySQL引擎_实操

380

17分6秒

58_ClickHouse高级_常见问题排查

350

4分21秒

59_ClickHouse监控_概述

370

11分44秒

60_ClickHouse监控_Prometheus&Grafana安装

430

3分8秒

61_ClickHouse监控_ClickHouse配置

470

15分55秒

62_ClickHouse监控_配置监控实现

400

26分48秒

63_ClickHouse备份_手动实现备份及恢复

460

22分36秒

64_ClickHouse备份_使用clickhouse-backup

550

47_ClickHouse高级_多表关联_大小表JOIN

我来说两句

作者

相关推荐

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐