文章/答案/技术大牛

发布

首页视频122-尚硅谷-Flink实时数仓-DWS层-ClickHouse 概述&特点

122-尚硅谷-Flink实时数仓-DWS层-ClickHouse 概述&特点

2022-12-022022-12-02 16:02:25播放35

点赞0 收藏 0

3.尚硅谷大数据学科--项目实战/尚硅谷大数据项目之Flink实时数仓/视频/122-尚硅谷-Flink实时数仓-DWS层-ClickHouse 概述&特点.mp4

原链接：http://www.atguigu.com/

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:00
好，那接下来呢，我们就看第一章叫克浩斯这个入门，入门呢，首先它是由。战斗民族对吧啊。就公司这是一个公司名啊，这个不是一个单一个的人名，这个公司名啊，他们去开源的这个公司呢，也是做搜索的啊，他在俄罗斯的地位呢，相当于这个国际上的谷歌啊，中国的百度啊，这种地位差不多啊，在俄罗斯的地位啊，啊大一六年开源的，其实也不算太长时间，对吧，任何一个框架呢，才几年的时间啊，才几年时间，你像我们的呃，好多框架都比这个要早很多。像fli啊，Spark都比这个早太多了，对吧，然后它是这个劣势存储数据库。啊，劣势存储，那对于劣势存储他更擅长于做什么事。列式存储的数据库更擅长于做什么事啊？
01:13
查询。查这个也太太，就是说查询的。这也太太笼统了。那按行存它就不适合查询了嘛，对吧，你不能这样说，有的人说按列查询这个没问题啊，其实他更擅长的做这种聚合吧。聚合操作对吧，比方说count呀，Some呀等等的。对，呃，压缩效率高，班长说的没问题啊，因为按列存我们。一列的数据放在一起，那这个时候呢，呃，我们同一个列可以采用相同的压缩算法，不同的类型可以用不同的压缩算法，对吧？啊，效率会更高一点啊，其实更重要的在于它查询当中呢，做这种聚合查询更擅长一些啊，更擅长些好，那使用C加加语言编写的主要用于op对吧？相对的op之外还有一个什么东西啊。
02:20
还有一个叫什么名词。跟orp很像的。对，叫OTP对吧，好，那它们俩的特点呢。他俩的特点分别是什么？Transaction。嗯。那。Op跟oltp他们所主要应对的场景是什么？
03:09
对吧，这个我就不等大家去回答了，因为有网络延迟啊，那orp这个东西呢，它更擅长的是一次写入多次读取啊，就是做查，其实orp数据库啊，更重要的就在于查。查数据对吧，而or TP呢？它最重要的在于增删改查。啊，它在于增删改查对吧，这四个都要去做的。啊，就是还有一个事物啊，对吧，连接事物查询，连接在线分析处理啊好，那之后呢，能够使用S查询实时生成的分析数据报告。对吧，啊，这个都还好一点，主要的就在于第一个历史存储，第二个它是一个orp。好，那之后呢，我们看一下它的一个特点啊，东西比较多，但是也没必要说都记下来了解一下啊，了解一下第一个列式存储，这个我们已经说过了。
04:08
对吧，这个已经说过了啊，假如说查某个人的所有属性的时候，通过一个磁盘读取，那这个明显是行存更好，所有属性嘛，对吧，ID姓名跟年龄啊，但是如果说我们要查所有人的年龄的时候。对吧，啊，查年龄或者说要按照年龄聚合呀，等等这些时候呢，它明显列出更好一点，对吧，这这是它的一个优点啊，之前也已经说过了啊，已经说过了啊。好，那第二个它是一个。数据库啊，那包含了什么呢？大部分的搜个语法，这个我们也提到过了，包括。DDL和DML，也就是说建库建表对吧，然后查询增删改查这些东西呢，都有啊，以及配套的各种函数啊，各种函数用户管理及前管理啊，数据的备份，数据备份对吧？后面呢，我们会讲那个副本集群啊，还有分片集群对吧？可以做这个备份啊。
05:09
好，那接下来呢，是我们的。第三个，第三个它有很多种不同的一个引擎。它有很多种不同的引擎啊呃，MY的一个类似。对吧，啊，可以做不同的引擎，那它里边呢，有这个合并数日志接口啊，这些东西呢，总共有20多种引擎，非常庞大。每一种引擎的功能还不太一样，每一个引擎的功能都不太一样啊，这个要注意一下对吧？呃，那接下来呢，高吞吐的写入能力啊，这个主要在于它跟那个东西很像啊呢，也基于这么样的一个数据结构对吧？Lsm数这样的一个数据结构，也就结合的磁盘和内存两块东西来用的啊好，那数据呢，它也假如说你要去改一个数据对吧，新写入了一个数据，那他也不是说立马就去改了。
06:07
立马就改了，假如说你新写一个完全一样的主件，一样的数据，对吧，它会在后台进行定时合并。啊，他会会合并，当然了，我们要在课堂上演示的时候，我会用手动合并的方式，对吧，我要等着它自动合并，那也不知道等到什么时候去了啊跟一样啊，他呢也是有这个。按照我们的先写内存，然后再写磁盘。啊，然后再写磁盘的方式。这个意思对，预写日志。啊好，这个你了解一下啊，高吞吐其实跟整个里边很像啊，整个的一个读写的一个流程，然后接下来数据的分区与线程级比级，那这个讲的什么意思呢？就是说在我们这个里边。可以做到分区。可以建一张分区表对吧？啊，建一张分区表啊呃，那如分区有什么好处啊。
07:06
Have里边我们接触到的分区对吧？分区的好处就在于如果说我们做了什么事。在查询的时候写了分区的过滤条件，那么就可以避免掉全表扫描。对吧？啊，避免全面扫描没问题啊，啊没问题的，这个地方要注意一下，我们这个地方叫分区，最后一张呢，我们讲的是切片，也就分片，注意这两个东西不是一个不是一个概念啊，不是一个概念对吧，这个要注意一下啊，最后一张分片呢，讲的是集群，这个地方就简简单单分区，它可以用一一台机器也能做分区表。也能做分区表啊，是这个意思对吧？好呃，那接下来呢，这边说了划分多个分区对吧，每个分区呢，进行这个有索引啊，可以建索引，但不是说一定有索引，这个不是的，对吧？好，那然后呢，通过多个CPU同时并行处理我们的多个分区的数据，这样这样它有个什么好处呢。
08:14
速度快，效率高，对吧，我多个分区之间可以并行啊，更重要的一个点在于什么呢？在于这个啊，这句话一定要注意一下，单个查询就能够利用整机的所有的CPU。对吧，假如说我们分了好多区，好多区对吧，假如说十个区正好呢，我有十个CPU10核对吧？啊那一个分区一个核，最大的并行，最大的一个并行对吧？好呃，降低了这个查询延迟，但是有一个问题啊，有一个问题一个弊端，什么意思呢？如果说。如果说我们有一个思语句占用了这个所有的CPU，那我如果同时有多个S在运行呢？那必然会导致我们的什么？
09:02
CPU的真抢？对吧，资源的增强，所以呢，呃，如果说你的QS很高。高QPS，也就是同时会用到很多很多，要运行很多很多搜的时候，反而他不那么擅长了。对吧，因为它是一个分区一个。啊，一个分区。一个CPU，那如果说你要多了，那肯定不擅长了，对吧，这个应该能明白吧。啊。大家不要犯困啊，中午刚起来对吧，又犯困。OK吗？这款。这没什么问题啊，对好，那我们就继续往下看，接下来呢，是有一个网上人家做的一个性能对比啊，那我们把这个收起来，这个呢我们放大一点。
10:02
好，那这里面呢，有一些点啊，来我们来看一下。这个就能看清了，对吧，首先我们测的是一个单表啊，然后呢，关联就是说。有join或者是同时执行多条CIRCLE2个方式啊好，那这里边呢，有一些框架，我们知道的，比方说这个press对吧，有的不认识的没见过就不管了。然后呢，是吧，收口。House我们将要学的，对吧？Clean house在这，好，那还有一个have，其实have都不用比了，而且看这个时间啊，我们就知道它这个have呢是on的，基于MR的，如果是基于SPA，那跟这个应该差不多，差别不大，当然Spark so肯定要快一点。对吧，因为SPASO呢，它用的是呃，Data frame data set r have走的是RDD，好，那这边pressure看一下一个总共有九个so索，对吧，它总耗时。
11:01
200秒啊，斯巴克呢，300秒，而耗的总耗时是85。总号是85对吧，Have这个就不聊了，这个就很高了，对吧，其他的我们没有用过的，我们就不用看啊啊不用看了，好这边呢，你要看一下明显的在于格列号，它这个性能更优一点。对吧，啊更优一点，好，接下来我们看关联上去多条circle口，多条circle口，那这个里边呢，Have也就排除了，人家单位是秒have已经到什么了。开都已经到小时了，六个小时了，那这个就没法比了，对吧啊，人家可能几十分钟啊，你好几个小时好几个小时对吧？啊，那这个SPA。690秒克林号呢，你看啊，你主要那也就说这个还更优一点啊。对吧，更优一点，但是你不能光这样比，咱们是不是还要这样去比，那上面是85克奥的85，这个呢，变成了685变600，那这个是300变600，对吧，相当于double一下，因为关联查询嘛，然后double一下啊，你再看这个。
12:09
Pre呢，之前是200对吧，关联上去还是200，也就是说pre呢，它完全基于这个内存运算啊，只要你数据量不是说特别大，它就几乎不带电。对吧，几乎不带变，那很明显看到克雷浩呢，他不擅长同时处理。多个circle，哪怕是关联，类似于这种draw，对吧，他也不太擅长啊，所以呢，其实通过网上的这个帖子，这个对比，我们去了解到，主要在于刚才我们所看到的第五第五个特点当中，对吧，就描述了他呢，很有可能单个查询就用了所有的一个CPU，那当你做多个查询或者关联查询的时候，效率势必会下降。对吧，因为一定会产生这个资源的争抢啊，一定会产生这个资源的争抢啊，所以说这个要注意一下，这是我们所聊的click house，它是什么东西以及。
13:05
它的一个特点对吧，这块东西呢，我们做一个了解啊，知道一下就好。

展开

我来说两句

0 条评论

登录后参与评论

作者

腾讯云开发者课程

【合辑】尚硅谷大数据项目之Flink实时数仓

（122/200）

9分56秒

001-尚硅谷-Flink实时数仓-课程介绍

440

13分30秒

002-尚硅谷-Flink实时数仓-项目介绍

490

4分56秒

003-尚硅谷-Flink实时数仓-采集模块-课程介绍

440

7分45秒

004-尚硅谷-Flink实时数仓-采集模块-数仓分层之为什么分层

370

11分14秒

005-尚硅谷-Flink实时数仓-采集模块-数仓分层之分层明细

420

17分30秒

006-尚硅谷-Flink实时数仓-采集模块-整体需求介绍

420

9分35秒

007-尚硅谷-Flink实时数仓-采集模块-离线架构分析之Sqoop&Flume

380

19分2秒

008-尚硅谷-Flink实时数仓-采集模块-离线架构分析之FlumeTairDirSource问题提出&解决

430

28分25秒

009-尚硅谷-Flink实时数仓-采集模块-离线架构分析之Kafka

400

7分55秒

010-尚硅谷-Flink实时数仓-采集模块-离线架构分析之其他

360

11分57秒

011-尚硅谷-Flink实时数仓-采集模块-实时架构分析

420

10分45秒

012-尚硅谷-Flink实时数仓-采集模块-架构对比

430

5分49秒

013-尚硅谷-Flink实时数仓-采集模块-日志数据采集之需求分析

410

5分27秒

014-尚硅谷-Flink实时数仓-采集模块-日志数据采集之MockJar包测试

490

8分13秒

015-尚硅谷-Flink实时数仓-采集模块-日志数据采集之SpringBoot简单介绍

390

17分52秒

016-尚硅谷-Flink实时数仓-采集模块-日志数据采集之SpringBoot创建项目&简单测试

410

3分45秒

017-尚硅谷-Flink实时数仓-采集模块-日志数据采集之SpringBoot创建项目&加参数测试

440

15分46秒

018-尚硅谷-Flink实时数仓-采集模块-日志数据采集之数据落盘&写入Kafka 编码

460

5分5秒

019-尚硅谷-Flink实时数仓-采集模块-日志数据采集之数据落盘&写入Kafka 本地测试

420

4分57秒

020-尚硅谷-Flink实时数仓-采集模块-日志数据采集之数据落盘&写入Kafka 单机测试

370

9分36秒

021-尚硅谷-Flink实时数仓-采集模块-日志数据采集之Nginx 介绍

480

9分5秒

022-尚硅谷-Flink实时数仓-采集模块-日志数据采集之Nginx 安装&启动

340

10分14秒

023-尚硅谷-Flink实时数仓-采集模块-日志数据采集之Nginx 配置负载均衡&测试

390

12分56秒

024-尚硅谷-Flink实时数仓-采集模块-日志数据采集之集群测试

440

5分19秒

025-尚硅谷-Flink实时数仓-采集模块-业务数据采集之建库&建表

420

10分27秒

026-尚硅谷-Flink实时数仓-采集模块-业务数据采集之FlinkCDC 什么是CDC&对比

350

11分13秒

027-尚硅谷-Flink实时数仓-采集模块-业务数据采集之FlinkCDC 介绍

430

21分33秒

028-尚硅谷-Flink实时数仓-采集模块-业务数据采集之FlinkCDC DataStream方式编码

460

10分34秒

029-尚硅谷-Flink实时数仓-采集模块-业务数据采集之FlinkCDC DataStream方式测试

460

16分54秒

030-尚硅谷-Flink实时数仓-采集模块-业务数据采集之FlinkCDC DataStreamAPI 设置CK&打包&开启集群

520

12分11秒

031-尚硅谷-Flink实时数仓-采集模块-业务数据采集之FlinkCDC DataStreamAPI 打包进行断点续传测试

520

11分43秒

032-尚硅谷-Flink实时数仓-采集模块-业务数据采集之FlinkCDC FlinkSQLAPI 编码&测试

460

13分21秒

033-尚硅谷-Flink实时数仓-采集模块-业务数据采集之FlinkCDC DataStreamAPI 自定义反序列化器格式说明

400

16分47秒

034-尚硅谷-Flink实时数仓-采集模块-业务数据采集之FlinkCDC DataStreamAPI 自定义反序列化器编码完成

420

6分14秒

035-尚硅谷-Flink实时数仓-采集模块-业务数据采集之FlinkCDC DataStreamAPI 自定义反序列化器代码测试

380

3分30秒

036-尚硅谷-Flink实时数仓-采集模块-业务数据采集之FlinkCDC DataStreamAPI&FlinkSQL对比

460

12分21秒

037-尚硅谷-Flink实时数仓-采集模块-业务数据采集之Maxwell 安装说明&测试

380

8分36秒

038-尚硅谷-Flink实时数仓-采集模块-业务数据采集之Canal 安装说明&测试

400

15分15秒

039-尚硅谷-Flink实时数仓-采集模块-业务数据采集之CDC对比

430

11分47秒

040-尚硅谷-Flink实时数仓-采集模块-业务数据采集之读取MySQL数据并写入Kafka 编码

340

4分39秒

041-尚硅谷-Flink实时数仓-采集模块-业务数据采集之读取MySQL数据并写入Kafka 测试

360

6分15秒

042-尚硅谷-Flink实时数仓-DWD&DIM-课程介绍

370

9分51秒

043-尚硅谷-Flink实时数仓-DWD&DIM-行为数据需求分析

370

8分52秒

044-尚硅谷-Flink实时数仓-DWD&DIM-行为数据思路整理&消费Kafka数据

400

8分15秒

045-尚硅谷-Flink实时数仓-DWD&DIM-行为数据将数据转换为JSON对象

350

11分22秒

046-尚硅谷-Flink实时数仓-DWD&DIM-行为数据新老用户校验

440

11分7秒

047-尚硅谷-Flink实时数仓-DWD&DIM-行为数据侧输出流&写入Kafka

340

10分45秒

048-尚硅谷-Flink实时数仓-DWD&DIM-行为数据测试

290

28分38秒

049-尚硅谷-Flink实时数仓-DWD&DIM-业务数据之需求分析

520

6分37秒

050-尚硅谷-Flink实时数仓-DWD&DIM-业务数据之代码逻辑梳理

420

5分1秒

051-尚硅谷-Flink实时数仓-DWD&DIM-业务数据之代码编写消费数据并过滤

370

4分11秒

052-尚硅谷-Flink实时数仓-DWD&DIM-业务数据之代码编写读取配置表创建广播流

330

23分15秒

053-尚硅谷-Flink实时数仓-DWD&DIM-业务数据之代码编写配置表字段分析&建表&JavaBean

470

4分47秒

054-尚硅谷-Flink实时数仓-DWD&DIM-业务数据之代码编写开启配置表Binlog并测试

360

8分34秒

055-尚硅谷-Flink实时数仓-DWD&DIM-业务数据之代码编写连接主流&广播流并分析业务逻辑

350

9分12秒

056-尚硅谷-Flink实时数仓-DWD&DIM-业务数据之代码编写创建TableProcessFunction并初始化相关参数

360

17分51秒

057-尚硅谷-Flink实时数仓-DWD&DIM-业务数据之代码编写处理广播流数据解析数据&建表

470

1分10秒

058-尚硅谷-Flink实时数仓-DWD&DIM-业务数据之代码编写处理广播流数据写入状态

320

17分10秒

059-尚硅谷-Flink实时数仓-DWD&DIM-业务数据之代码编写处理主流数据读取状态&过滤字段

350

5分15秒

060-尚硅谷-Flink实时数仓-DWD&DIM-业务数据之代码编写处理主流数据补充SinkTable&分流

400

7分17秒

061-尚硅谷-Flink实时数仓-DWD&DIM-业务数据之代码编写检查代码

330

8分20秒

062-尚硅谷-Flink实时数仓-DWD&DIM-业务数据之代码编写测试准备

400

15分20秒

063-尚硅谷-Flink实时数仓-DWD&DIM-业务数据之代码编写测试

280

27分31秒

064-尚硅谷-Flink实时数仓-DWD&DIM-业务数据之代码编写将数据写入HBase 编码

340

21分4秒

065-尚硅谷-Flink实时数仓-DWD&DIM-业务数据之代码编写将数据写入Kafka 编码

390

6分48秒

066-尚硅谷-Flink实时数仓-DWD&DIM-业务数据之整体测试环境准备

360

15分12秒

067-尚硅谷-Flink实时数仓-DWD&DIM-业务数据之整体测试测试完成

300

11分38秒

068-尚硅谷-Flink实时数仓-ODS&DWD&DIM-小总结

420

7分19秒

069-尚硅谷-Flink实时数仓-ODS&DWD&DIM-SQL分享需求说明&建表&导数据

380

30分15秒

070-尚硅谷-Flink实时数仓-ODS&DWD&DIM-SQL分享方案一

340

18分42秒

071-尚硅谷-Flink实时数仓-ODS&DWD&DIM-SQL分享方案二

340

2分12秒

072-尚硅谷-Flink实时数仓-ODS&DWD&DIM-SQL分享 HiveOnSpark Bug说明

400

16分29秒

073-尚硅谷-Flink实时数仓-DWM层-需求分析

370

9分29秒

074-尚硅谷-Flink实时数仓-DWM层-访客UV 需求分析

440

4分21秒

075-尚硅谷-Flink实时数仓-DWM层-访客UV 代码编写消费数据并转换为JSON对象

390

15分16秒

076-尚硅谷-Flink实时数仓-DWM层-访客UV 代码编写过滤数据

370

13分12秒

077-尚硅谷-Flink实时数仓-DWM层-访客UV 代码编写设置状态超时时间防止状态过大

370

8分18秒

078-尚硅谷-Flink实时数仓-DWM层-访客UV 代码测试

320

12分25秒

079-尚硅谷-Flink实时数仓-DWM层-跳出明细需求分析

360

15分32秒

080-尚硅谷-Flink实时数仓-DWM层-跳出明细代码编写

380

12分20秒

081-尚硅谷-Flink实时数仓-DWM层-跳出明细代码测试

260

7分55秒

082-尚硅谷-Flink实时数仓-DWM层-跳出明细测试

410

3分8秒

083-尚硅谷-Flink实时数仓-DWM层-跳出明细 CEP 循环模式

370

5分25秒

084-尚硅谷-Flink实时数仓-DWM层-订单宽表需求分析

360

17分21秒

085-尚硅谷-Flink实时数仓-DWM层-订单宽表双流JOIN 官方文档说明

390

9分15秒

086-尚硅谷-Flink实时数仓-DWM层-订单宽表双流JOIN 代码编写

340

12分23秒

087-尚硅谷-Flink实时数仓-DWM层-订单宽表双流JOIN 代码测试

350

11分28秒

088-尚硅谷-Flink实时数仓-DWM层-订单宽表代码编写消费Kafka数据&转换JavaBean&提取事件时间

430

9分13秒

089-尚硅谷-Flink实时数仓-DWM层-订单宽表代码编写订单与订单明细表双流JOIN

430

10分59秒

090-尚硅谷-Flink实时数仓-DWM层-订单宽表代码测试准备工作

440

5分57秒

091-尚硅谷-Flink实时数仓-DWM层-订单宽表代码测试测试完成

390

5分13秒

092-尚硅谷-Flink实时数仓-DWM层-订单宽表关联维度思路梳理

430

9分39秒

093-尚硅谷-Flink实时数仓-DWM层-订单宽表关联维度 JDBCUtil 返回值&参数说明

350

19分24秒

094-尚硅谷-Flink实时数仓-DWM层-订单宽表关联维度 JDBCUtil 查询&封装泛型对象

410

4分14秒

095-尚硅谷-Flink实时数仓-DWM层-订单宽表关联维度 JDBCUtil 测试

340

15分48秒

096-尚硅谷-Flink实时数仓-DWM层-订单宽表关联维度 DimUtil封装&优化的必要性

360

10分52秒

097-尚硅谷-Flink实时数仓-DWM层-订单宽表关联维度优化1旁路缓存思路分析

400

15分34秒

098-尚硅谷-Flink实时数仓-DWM层-订单宽表关联维度优化1旁路缓存 Redis工具类&Key的设计

430

13分40秒

099-尚硅谷-Flink实时数仓-DWM层-订单宽表关联维度优化1旁路缓存代码编写

360

100

8分29秒

100-尚硅谷-Flink实时数仓-DWM层-订单宽表关联维度优化1旁路缓存代码测试

450

101

21分20秒

101-尚硅谷-Flink实时数仓-DWM层-订单宽表回顾

390

102

14分38秒

102-尚硅谷-Flink实时数仓-DWM层-订单宽表关联维度优化2 异步IO说明

370

103

4分51秒

103-尚硅谷-Flink实时数仓-DWM层-订单宽表关联维度优化2 异步IO编码步骤

380

104

22分31秒

104-尚硅谷-Flink实时数仓-DWM层-订单宽表关联维度优化2 异步IO编码初始化函数

410

105

23分57秒

105-尚硅谷-Flink实时数仓-DWM层-订单宽表关联维度优化2 异步IO编码异步函数完成

370

106

17分43秒

106-尚硅谷-Flink实时数仓-DWM层-订单宽表关联维度优化2 异步IO编码测试准备

360

107

9分52秒

107-尚硅谷-Flink实时数仓-DWM层-订单宽表关联维度优化2 异步IO编码测试完成

390

108

8分35秒

108-尚硅谷-Flink实时数仓-DWM层-订单宽表关联维度补充其他维度信息

370

109

4分45秒

109-尚硅谷-Flink实时数仓-DWM层-订单宽表最终测试

380

110

6分35秒

110-尚硅谷-Flink实时数仓-DWM层-订单宽表不丢维度数据说明

440

111

9分30秒

111-尚硅谷-Flink实时数仓-DWM层-支付宽表需求分析

260

112

15分49秒

112-尚硅谷-Flink实时数仓-DWM层-支付宽表代码编写

380

113

8分39秒

113-尚硅谷-Flink实时数仓-DWM层-支付宽表代码测试

350

114

7分35秒

114-尚硅谷-Flink实时数仓-DWM层-支付宽表时间工具类说明

400

115

5分29秒

115-尚硅谷-Flink实时数仓-DWS层-课程介绍

390

116

13分43秒

116-尚硅谷-Flink实时数仓-DWS层-访客主题宽表需求分析

300

117

13分1秒

117-尚硅谷-Flink实时数仓-DWS层-访客主题宽表思路整理&读取Kafka数据

460

118

17分10秒

118-尚硅谷-Flink实时数仓-DWS层-访客主题宽表处理输出流&union&提取时间戳分组

370

119

18分2秒

119-尚硅谷-Flink实时数仓-DWS层-访客主题宽表开窗&聚合

330

120

17分13秒

120-尚硅谷-Flink实时数仓-DWS层-访客主题宽表打印测试

400

121

3分42秒

121-尚硅谷-Flink实时数仓-DWS层-ClickHouse 课程介绍

360

122

13分10秒

122-尚硅谷-Flink实时数仓-DWS层-ClickHouse 概述&特点

350

123

5分43秒

123-尚硅谷-Flink实时数仓-DWS层-ClickHouse 安装准备工作

330

124

10分23秒

124-尚硅谷-Flink实时数仓-DWS层-ClickHouse 安装&启动

390

125

16分47秒

125-尚硅谷-Flink实时数仓-DWS层-ClickHouse 数据类型

390

126

4分32秒

126-尚硅谷-Flink实时数仓-DWS层-ClickHouse 简单引擎介绍

390

127

10分32秒

127-尚硅谷-Flink实时数仓-DWS层-ClickHouse MergeTree

400

128

6分1秒

128-尚硅谷-Flink实时数仓-DWS层-ClickHouse MergeTree之Partition By

380

129

5分44秒

129-尚硅谷-Flink实时数仓-DWS层-ClickHouse MergeTree之Primary Key

340

130

4分19秒

130-尚硅谷-Flink实时数仓-DWS层-ClickHouse MergeTree之Order By

340

131

5分26秒

131-尚硅谷-Flink实时数仓-DWS层-ClickHouse MergeTree之TTL

340

132

7分52秒

132-尚硅谷-Flink实时数仓-DWS层-ClickHouse ReplacingMergeTree

410

133

6分20秒

133-尚硅谷-Flink实时数仓-DWS层-ClickHouse SummingMergeTree

380

134

15分4秒

134-尚硅谷-Flink实时数仓-DWS层-ClickHouse 引擎选择分析

340

135

13分39秒

135-尚硅谷-Flink实时数仓-DWS层-ClickHouse SQL操作一

310

136

23分2秒

136-尚硅谷-Flink实时数仓-DWS层-ClickHouse SQL操作二

330

137

11分14秒

137-尚硅谷-Flink实时数仓-DWS层-ClickHouse 副本机制

400

138

7分59秒

138-尚硅谷-Flink实时数仓-DWS层-ClickHouse 分片机制说明

350

139

13分19秒

139-尚硅谷-Flink实时数仓-DWS层-ClickHouse 分片机制实操

360

140

13分16秒

140-尚硅谷-Flink实时数仓-DWS层-访客主题 ClickHouseUtil 创建

400

141

12分8秒

141-尚硅谷-Flink实时数仓-DWS层-访客主题 ClickHouseUtil 封装

330

142

18分28秒

142-尚硅谷-Flink实时数仓-DWS层-访客主题 ClickHouseUtil 封装完成

410

143

9分24秒

143-尚硅谷-Flink实时数仓-DWS层-访客主题 ClickHouseUtil 测试完成

400

144

32分3秒

144-尚硅谷-Flink实时数仓-DWS层-商品主题需求分析

390

145

8分30秒

145-尚硅谷-Flink实时数仓-DWS层-商品主题 JavaBean说明

350

146

7分51秒

146-尚硅谷-Flink实时数仓-DWS层-商品主题代码编写思路整理&消费数据创建流

360

147

17分2秒

147-尚硅谷-Flink实时数仓-DWS层-商品主题代码编写处理页面日志&收藏数据&购物车数据

380

148

7分54秒

148-尚硅谷-Flink实时数仓-DWS层-商品主题代码编写处理订单&支付数据

350

149

8分51秒

149-尚硅谷-Flink实时数仓-DWS层-商品主题代码编写处理退单&评价数据

440

150

9分19秒

150-尚硅谷-Flink实时数仓-DWS层-商品主题代码编写分组开窗&聚合

390

151

9分31秒

151-尚硅谷-Flink实时数仓-DWS层-商品主题代码编写关联维度&将数据写入ClickHouse

380

152

21分36秒

152-尚硅谷-Flink实时数仓-DWS层-商品主题-整体测试

410

153

5分10秒

153-尚硅谷-Flink实时数仓-DWS层-商品主题-需求分析

350

154

22分43秒

154-尚硅谷-Flink实时数仓-DWS层-商品主题代码编写创建环境&使用DDL方式读取Kafka数据

450

155

10分29秒

155-尚硅谷-Flink实时数仓-DWS层-商品主题代码编写分组开窗聚合

370

156

7分6秒

156-尚硅谷-Flink实时数仓-DWS层-商品主题代码编写将动态表转换为流并打印

280

157

11分22秒

157-尚硅谷-Flink实时数仓-DWS层-商品主题代码编写将数据写入ClickHouse&测试

370

158

4分21秒

158-尚硅谷-Flink实时数仓-DWS层-关键词主题需求分析

360

159

9分51秒

159-尚硅谷-Flink实时数仓-DWS层-关键词主题代码编写分词工具类封装

360

160

12分0秒

160-尚硅谷-Flink实时数仓-DWS层-关键词主题代码编写分词UDTF

370

161

16分57秒

161-尚硅谷-Flink实时数仓-DWS层-关键词主题代码编写思路分析&读取数据&建表

410

162

10分55秒

162-尚硅谷-Flink实时数仓-DWS层-关键词主题代码编写分词&开窗聚合

390

163

9分10秒

163-尚硅谷-Flink实时数仓-DWS层-关键词主题代码编写动态表转换为流&写入ClickHouse

260

164

4分6秒

164-尚硅谷-Flink实时数仓-DWS层-关键词主题代码测试

340

165

7分35秒

165-尚硅谷-Flink实时数仓-数据可视化-课程介绍

410

166

4分9秒

166-尚硅谷-Flink实时数仓-数据可视化-Sugar 创建大屏

460

167

4分11秒

167-尚硅谷-Flink实时数仓-数据可视化-Sugar 使用步骤介绍

430

168

5分9秒

168-尚硅谷-Flink实时数仓-数据可视化-数据接口项目构建

400

169

10分0秒

169-尚硅谷-Flink实时数仓-数据可视化-数据接口依赖导入&分层说明

360

170

5分0秒

170-尚硅谷-Flink实时数仓-数据可视化-数据接口 GMV接口 Mapper完成

450

171

9分17秒

171-尚硅谷-Flink实时数仓-数据可视化-数据接口 GMV接口 Service&Controller完成

380

172

3分50秒

172-尚硅谷-Flink实时数仓-数据可视化-数据接口 GMV接口测试

440

173

13分58秒

173-尚硅谷-Flink实时数仓-数据可视化-数据接口 GMV接口对接Sugar

370

174

12分40秒

174-尚硅谷-Flink实时数仓-数据可视化-数据接口品牌GMV接口 Mapper完成

390

175

5分40秒

175-尚硅谷-Flink实时数仓-数据可视化-数据接口品牌GMV接口 Service完成

330

176

3分48秒

176-尚硅谷-Flink实时数仓-数据可视化-数据接口品牌GMV接口 Controller完成

420

177

7分36秒

177-尚硅谷-Flink实时数仓-数据可视化-数据接口品牌GMV接口测试完成

320

178

3分39秒

178-尚硅谷-Flink实时数仓-数据可视化-数据接口品牌GMV接口对接Sugar

290

179

8分38秒

179-尚硅谷-Flink实时数仓-数据可视化-数据接口导入代码&品类GMV&SPU GMV

380

180

11分52秒

180-尚硅谷-Flink实时数仓-数据可视化-数据接口其他需求图表

330

181

13分29秒

181-尚硅谷-Flink实时数仓-数据可视化-最终测试

350

182

11分19秒

182-尚硅谷-Flink优化-课程介绍

430

183

14分46秒

183-尚硅谷-Flink优化-资源优化之内存设置

420

184

11分35秒

184-尚硅谷-Flink优化-资源优化之并行度设置

320

185

13分4秒

185-尚硅谷-Flink优化-资源优化之RockDB配置

330

186

4分25秒

186-尚硅谷-Flink优化-资源优化之CheckPoint配置

350

187

8分19秒

187-尚硅谷-Flink优化-资源优化之ParameterTool的介绍

410

188

26分27秒

188-尚硅谷-Flink优化-反压处理之反压介绍&定位

430

189

16分27秒

189-尚硅谷-Flink优化-反压处理之反压问题解决

390

190

2分16秒

190-尚硅谷-Flink优化-数据倾斜之定位问题

360

191

6分40秒

191-尚硅谷-Flink优化-数据倾斜之KeyBy之前的数据倾斜

390

192

18分55秒

192-尚硅谷-Flink优化-数据倾斜之KeyBy之后直接聚合

460

193

15分39秒

193-尚硅谷-Flink优化-数据倾斜之KeyBy之后开窗聚合

370

194

27分39秒

194-尚硅谷-Flink优化-KafkaSource

460

195

8分41秒

195-尚硅谷-Flink优化-FlinkSQL优化之MiniBatch

390

196

3分39秒

196-尚硅谷-Flink优化-FlinkSQL优化之LocalGlobal

430

197

3分34秒

197-尚硅谷-Flink优化-FlinkSQL优化之SplitDistinct

270

198

1分38秒

198-尚硅谷-Flink优化-FlinkSQL优化之Agg With Filter

400

199

10分8秒

199-尚硅谷-Flink优化-FlinkSQL优化之TopN优化

380

200

5分37秒

200-尚硅谷-Flink优化-FlinkSQL优化之去重方案&其他

430

122-尚硅谷-Flink实时数仓-DWS层-ClickHouse 概述&特点

我来说两句

作者

相关推荐

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐