文章/答案/技术大牛

发布

首页视频16_ClickHouse入门_开发中引擎的选择

16_ClickHouse入门_开发中引擎的选择

2022-12-022022-12-02 16:02:17播放41

点赞0 收藏 0

2.尚硅谷大数据学科--核心框架/尚硅谷大数据技术之ClickHouse/视频/16_ClickHouse入门_开发中引擎的选择.mp4

原链接：http://www.atguigu.com/

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:00
那介绍完两个比较常用的合并术引擎，那大家觉得哪一种会更好用一点，或者说更符合咱们实际开发一点？啊。那好了，假设咱们可里卡house存储的就是一一张宽表啊，聚合完了，那也不一定聚合完对吧，也可能是存明细也都有可能啊，反正各种场景都有可能，那很多时候咱们是不是要做一些聚合查询，你可能觉得是不是用三。类似的，这种聚合类型的预聚合的合并数引擎会好一点，但是它有一个问题，同学们，它能保证幂等性吗？咱们实时系统非呃经常会比较讲究这个数据的一致性，对吧，一致性，那你想想密等性能保证吗。这就看你的取舍了，为啥呢？如果啊，这假设这是你的一个计算引擎，比如说flink吧。那你呃，往克里号里面写。那你是不是有一个问题重复写入啊，那什么情况下会出现一个重复写入呢？就是说我已经写进去了。
01:06
但是我这个程序挂。我我这个计算引擎这个任务挂了，然后呢，你是不是flink本身有一个，呃，那个什么check po机制，对吧，它是不是又恢复了他的一个状态，然后他如果又重新写入了呢。比如说他这一批次写入要写100条，但已经写了50条，但还没写完，他挂了，他是不是认为是失败的，他重启起来。作业重新启动起来，他是不是还会将这100条数据再写一遍？有可能吧，那你想想，对于click house来讲，它是不是产生了50条的重复数据啊，那你自动的三米引擎，它是把重复的50条也算进去了，对不对？那如果你对幂等性要求特别高的话，呃，就数据的一致性，那很显然是不符合要求的，那这个时候你只能选择谁呀？这个是比较合适啊。
02:02
Replacing me。他能保证一个最终一致性，对吧？他会帮我们去宠，但是我们说用它并不是高枕无忧。为啥呢？我们说了，如果不是同一批次插入的，并且。你查的时候他没执行，呃，合并分片的话，那这个时候可能数据还是有重复的呗，那我们说呢，你你可以当然是有办法解决的，基于这个引擎的话，呃，那办法呢，在咱们高阶里面会谈到对吧，一个是。有的同学就说啊。战斗民族就要简单直接或怎么样。每次查询前执行一个手动。合并分片，那你想想，你每次都要去查的时候，都要执行一次分片，那肯定可耗，还玩啥，天天在服务你就得了呗。对吧，那你执行分配的时候，数据还能写入吗？还能读吗？对吧，所以你要悠着点啊，你不要以为手动咱们前面演示那么多都是什么手动手动合合并手动合并这种是为了咱们快速演示这个效果。
03:13
当然你在生产环境要执行这个命令，你要考虑清楚啊，因为可能你会影响线上的业务，对吧，这个得慎重。第二种方式就是自己去从。也就是说，比如说利用group，或者说我可以加一个字段做标记，对吧，咱们后面展开介绍啊呃，就有点参考，而且base的一个做法，那还有一种呢，可以加final。关键字final呢，它其实。会自动帮我们做一个过滤。只查最新的数据啊，重复的数据它只会选择一条啊，但是这个final你也得想想，它有版本区别，再老一点的版本，你加final查询的话，它是单线程的。
04:00
在20.8，也就20年八月份之发布的稳定版呢，它才支持多线程。这个也是一个点对吧，所以在早期呃，在早一点呃，有些企业装的是一些老版本的话，他们优先选的方案估计是这种自己通过语法来实现。啊，通过语法来实现，但是。甚至有些企业会怎么选呢？我不管。你只要能定期给我去重就行了，说为什么呢？这就有一个取舍问题，我的数据量，比如说每天有100亿条，每天啊，那我可能发生重复的概率是比较小的，对吧？除非你中间某一个环节出现了故障，重启了，重试了，才会产生一小部分的重复数据，是不是一小部分，那这个时候我是可以忍受的呀。比如说我100亿，那最终统计出来是100亿啊，零一万条，那你这1万重复出来无所谓啊，那这种场景你是可以忽略，但如果是跟钱相关，这1万条也不能忽略。
05:05
对吧，这所以要结合你实际的业务场景来看啊，那至于后面这几种方案，我还是建议大家好好去了解了解，好吧，那咱们高级部分有展开详细介绍。

展开

我来说两句

0 条评论

登录后参与评论

作者

腾讯云开发者课程

【合辑】尚硅谷大数据技术之ClickHouse

（16/64）

13分13秒

01_ClickHouse总体_课程介绍

520

3分24秒

02_ClickHouse入门_课程介绍

510

24分51秒

03_ClickHouse入门_介绍&特点

490

18分36秒

04_ClickHouse入门_安装_准备工作

490

25分11秒

05_ClickHouse入门_安装_单机安装

440

21分38秒

06_ClickHouse入门_数据类型

470

14分16秒

07_ClickHouse入门_表引擎介绍

390

8分24秒

08_ClickHouse入门_MergeTree引擎_简单使用

370

33分24秒

09_ClickHouse入门_MergeTree引擎_分区详解

400

4分27秒

10_ClickHouse入门_MergeTree引擎_主键

370

6分10秒

11_ClickHouse入门_MergeTree引擎_Order by

420

12分6秒

12_ClickHouse入门_MergeTree引擎_二级索引

490

11分59秒

13_ClickHouse入门_MergeTree引擎_TTL

390

11分38秒

14_ClickHouse入门_ReplacingMergeTree引擎

490

10分21秒

15_ClickHouse入门_SummingMergeTree引擎

400

5分19秒

16_ClickHouse入门_开发中引擎的选择

410

14分6秒

17_ClickHouse入门_SQL操作_Update和Delete

380

11分1秒

18_ClickHouse入门_SQL操作_查询和函数介绍

450

13分31秒

19_ClickHouse入门_SQL操作_多维分析函数

400

4分43秒

20_ClickHouse入门_SQL操作_alter&导出

490

18分38秒

21_ClickHouse入门_副本引擎

370

16分32秒

22_ClickHouse入门_分片集群介绍

350

21分52秒

23_ClickHouse入门_分片集群实操

510

3分56秒

24_ClickHouse高级_课程简介

470

8分29秒

25_ClickHouse高级_新版本安装&.官网在线demo介绍

450

8分23秒

26_ClickHouse高级_执行计划_plan&AST

360

5分45秒

27_ClickHouse高级_执行计划_syntax&pipeline

430

4分19秒

28_ClickHouse高级_执行计划_老版本如何查看

300

8分49秒

29_ClickHouse高级_建表优化_注意数据类型

410

6分27秒

30_ClickHouse高级_建表优化_分区和索引

350

8分59秒

31_ClickHouse高级_表参数&写入和删除优化

430

24分19秒

32_ClickHouse高级_CPU参数设置

360

6分7秒

33_ClickHouse高级_内存参数设置

470

2分48秒

34_ClickHouse高级_存储优化

400

10分40秒

35_ClickHouse高级_语法优化规则_准备测试用表

340

4分36秒

36_ClickHouse高级_语法优化规则_count优化

420

9分55秒

37_ClickHouse高级_语法优化规则_子查询重复字段&谓词下推

290

5分53秒

38_ClickHouse高级_语法优化规则_聚合计算外推&聚合函数消除

320

4分55秒

39_ClickHouse高级_语法优化规则_删除重复字段(不同语法下)

490

6分1秒

40_ClickHouse高级_语法优化规则_标量替换&三元运算优化

370

15分32秒

41_ClickHouse高级_单表查询优化_prewhere&采样

370

7分49秒

42_ClickHouse高级_单表查询优化_数据裁剪&Orderby用法

490

5分4秒

43_ClickHouse高级_单表查询优化_避免构建虚拟列

500

4分48秒

44_ClickHouse高级_单表查询优化_使用uniqCombined

440

9分7秒

45_ClickHouse高级_单表查询优化_使用物化视图&其他事项

410

6分55秒

46_ClickHouse高级_多表关联_使用IN代替JOIN

470

4分8秒

47_ClickHouse高级_多表关联_大小表JOIN

450

6分27秒

48_ClickHouse高级_多表关联_谓词下推

420

11分36秒

49_ClickHouse高级_多表关联_字典表&其他

420

8分4秒

50_ClickHouse高级_数据一致性_数据准备

430

2分4秒

51_ClickHouse高级_数据一致性_手动执行

400

9分58秒

52_ClickHouse高级_数据一致性_通过Group by去重

340

14分26秒

53_ClickHouse高级_数据一致性_使用Final&总结

770

8分17秒

54_ClickHouse高级_物化视图_概述

390

9分24秒

55_ClickHouse高级_物化视图_实操

340

8分16秒

56_ClickHouse高级_MaterializeMySQL引擎_概述

330

17分17秒

57_ClickHouse高级_MaterializeMySQL引擎_实操

380

17分6秒

58_ClickHouse高级_常见问题排查

350

4分21秒

59_ClickHouse监控_概述

370

11分44秒

60_ClickHouse监控_Prometheus&Grafana安装

430

3分8秒

61_ClickHouse监控_ClickHouse配置

470

15分55秒

62_ClickHouse监控_配置监控实现

400

26分48秒

63_ClickHouse备份_手动实现备份及恢复

460

22分36秒

64_ClickHouse备份_使用clickhouse-backup

550

16_ClickHouse入门_开发中引擎的选择

我来说两句

作者

相关推荐

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐