文章/答案/技术大牛

发布

首页视频134-尚硅谷-Flink实时数仓-DWS层-ClickHouse 引擎选择分析

134-尚硅谷-Flink实时数仓-DWS层-ClickHouse 引擎选择分析

2022-12-022022-12-02 16:02:25播放34

点赞0 收藏 0

3.尚硅谷大数据学科--项目实战/尚硅谷大数据项目之Flink实时数仓/视频/134-尚硅谷-Flink实时数仓-DWS层-ClickHouse 引擎选择分析.mp4

原链接：http://www.atguigu.com/

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:00
好，那接下来我们就要讨论一下，讨论一下什么问题呢？那你看我们主要列举的是这个replacing motor，还有这个sum米motor税，那想必啊，咱们这个实时数仓DWS仓就要从这两个里边去选了。对吧，好，那这两个大家想一下应该选哪一种呢。选这个replacing。还是选这个桑米娜。一还是二？大家觉得，然后并阐述理由啊，并说明一下理由。是一还是二呢？
01:11
啊，大家都觉得这个一。那看起来不是二更优吗？我们未来不就是按照那四个维度要做聚合操作做查询吗？我们不就是按天去算吗？去做聚合，做查询吗？为什么大家都会选择一呢？那明显我用第二种的话，它的效率更高呀。为什么大家统一的都选择了第一种，大家说的是密的。那我第二种也有优势啊，对吧。
02:00
有没有那种一棍子把第二个打死的？你一有幂等，我二可以聚合呀。第二种，不保证一定聚合完，嗯，那我说了可以用some去做处理吗？对吧，嗯，查最终查询的时候可以加一个扫。先保证准确再谈效率，这个没问题啊，其实先要保证这个准确性对吧，如果说呃，用的是sunny。那假如说任务出错了，我任务挂的。对吧，任务挂掉之后呢，呃，重启把这个数据重新消费了，我又写一次，那又写一次的时候，由于我们之前用的是这个。用的是失件时间对吧，用的是失件时间处理的，我们当时说了那个地方其实还有一种解决方式啊，就ug大家还记得吗？邮界啊，他他在正常处理的时候看不到，所以我们把这个呃，沃特曼延迟时间加了这个十秒钟啊，提到了这个12秒对吧，邮件就能看到了，当然我们说了还有一种方式，我们可以按照处理时间来。
03:25
开窗，我们可以完全可以按照处理时间来进行一个开窗，但是我们没有选中这种，那时说了，因为可以会考虑到隔离耗里边一个点啊，那如果用处理时间的话，你挂了re replace也不行，里面的心也不行，对吧，因为你是把数据已经聚合好，按十秒钟，十秒钟聚合好再写出去的，但是如果我们按事件时间呢，就没有问题了，对吧？哎，他可以把这个数据保证这个准确，但如果sum米不行，Sum米假如挂掉了，你重新消费，重新消费往里写，但是他已经搞不清楚你写的第一次还是第二次，第三次了，对吧？所以他没办法保证这个数据的一个准确性，最重要的是这个点啊，当然优先保证数据的准确性，再谈效率没有问题。
04:09
对吧，其实就是这个意思，好，那既然我们想好了用replacing motor tree，那大家能不能告诉我，关于这几个字段我们应该怎么写？这几个字段我们应该怎么写？对吧，首先爬梯任脉我们写什么？一个一个讨论啊。分区我们写什么？嗯，没有人回答了吗？我们按什么进行分区？
05:12
想一想啊，我们应该按什么进行分区？十秒四个维度分区吗？你看答案就奇奇怪怪的了。Create ts开装时间进行分区。STT。啊，STT进行分区是吗？那也就是说十秒一个区域是吗？
06:04
啊，按天，班长说按天YYYMMTDTD，按天。大家觉得分区啊，你有同学说十秒一个区，那你觉得合适吗？大家记得我们这个区啊，在这里边，在克林浩里边，它一个区是一个什么。一个文件夹，哎，那你要十秒一个分区，十秒一个分区，你不疯了吗。对吧，不可能分区能分到秒啊，所以按天是对的。对吧，按天分区好，第一个按天分区，往往来说我们都是按天分区啊，一天一个分区对吧？好呃，接下来主键，主键我们先不聊，因为它是属于索引对吧？索引没关系啊，假如奥曼，我们拿什么东西作为奥曼？就all的字段，我们应该用如何选择？
07:14
四个维度，嗯，还有没有不懂的。要要想啊，要想一定要思考这个问题。向总说，按照这四个维度，还有没有不同答案？班长说四个维度加两个时间啊，那两个时间肯定就是开窗的开始和结束时间了，对吧，其他同学呢，还有没有再想啊？其他同学也可以思考一下啊，有自己的想法都可以说一说，这个才是最关键的，对吧，你学了很多的东西，最后你要用了。
08:00
啊，那这个时候呢，我们才学核心的才学三个引擎对吧，Motor tree replacing motor和so motor，你就学三个，你三选一。啊，跟柯南一样，经常的经典三选一对吧，你选一个，那你未来学的东西越来越多，是不是可选择性就越多，你要思考对吧，每一种情况应该怎么做，有什么好处，有什么缺点。班长说，四个维度加两个时间。那相等说四个维度，那我们想哪个更好一点，还是说只能取一个，还是说两个都行？其他同学在这两个基础上去思考应该选择哪一种，是四个维度还是四加二？大家觉得哪种更好一点？其他同学可以来想一想啊，来把这个答案，把你自己认为的写在这个。弹幕里边。
09:01
啊，我来了解一下。四加一啊，俊豪说四加一，嗯。其他同学呢？就就这么难吗，这个题。四加一啊，又来一个四加一。那我们想一下，大家为什么都抛弃了四个维度，或者说四个维度它为什么不行，有没有同学说一说，或者向总你自己说一说，对吧？你现在有没有想过，想明白四个维度为什么不行？为什么只按四个维度不行？大家的答案呢？都至少带了一个时间，班长带两个对吧？你你现在向总，你现在自己能不能想明白四个维度为什么不行？对，班长给你回答了，因为主要原因在于什么，我们是按天注意，按天分区的。
10:05
我们前面聊了，你要注意我们聊的东西都是连贯的，我们是按天分去的，那一天每十秒钟啊，这个零秒到十秒，十秒到20秒，20秒到30秒，对吧，他都会有这四个维度吧。是不是都会有相同的这四个维度的组合，那如果按天分区，我们知道它在按天范围内进行去重，那是不是说十秒到20秒会把这个零到十的覆盖掉，20~30的会把十到20的覆掉，然后30~40的又把20~30的覆盖掉。对吧，因为他在天范围内记忆什么。进行去重，那你只按四个维度，那我每十秒是不是都会有这四个维度的组合？对不对，所以其实这个里边啊，如果说我们要选all by的字段，那。是四个维度至少加一个时间，但是加两个时间也可以，对吧，我加一个STT，或者说加一个e dt，至少得加一个。
11:09
大家思考一下这个问题啊，因为感觉这个问题大家不是很明白，因为很少有人敲弹幕。比较少，但是我相信说四加二或者四加一的同学应该没有问题。对吧啊，像班长啊，俊豪啊，子贺啊，都都没有问题啊。那你看没有问题的一点，咱只有三个人。啊，只有三个人对吧，其他同学呢，现在能不能明白了。我们首先按天分区，你不能按十秒分区啊，那如果说咱们按十秒分区啊，假如说十秒一个区，十秒一个区，那没问题，用四个维度是不是就够了。因为注意replacing啊，Mo tree它是在区内做驱同，对吧，如果说你真的按十秒一个区，那四个维度肯定是够了，但是我们说了它一个区是一个目录文。对吧，那你这个也太夸张了，十秒一个区，你一天得多少个目录啊，对吧，不能这样玩啊，肯定不能这样玩，所以最后呢，我们选用按天分区。
12:06
我们就选用按天分区啊，那要注意replace税呢，它是在分区范围内进行去重。啊，分区范围内进行去重，也就是说他在天一天的数据范围内进行一个去重，那如果说这个时候按四个维度，那就有问题了。对吧，只按四个维度，因为我们一天范围内是有很多个不同的窗口，而每一个窗口里面都会有。四个维度组合。啊，那也就相当于你后十秒的数据会完全把前十秒的数据覆盖掉。对吧？会把前面十秒的数据覆盖掉，OK吗？解释到这个程度大家能明白吗？怎么感觉还是有问题啊，大家疑惑的点在哪？如果说你不明白，你有疑惑，你可以把你疑惑的地方打在这个弹幕上，让我看一下。对吧，有同学觉得有疑问，那你可以敲出来我看一下，大家共同来看一下啊，有同学帮我解释更好啊，肯定有同学呢，会帮着回答这个问题，你看这个一明显很慢啊，明显很慢啊，大家可能还是存在一些小问题，要思考一下，对吧？要思考一下，但这个问题并不难啊，我已经说明白了，已经给他说了，对吧？把它讲出来了，你就应该能想明白。
13:21
啊，但是还是有好多同学，有没有同学愿意分享一下你的会里面的点在哪啊，让大家共同来看一看。你说一下你不明白的点。也没有啊，反正就是我不敲一我也不说我哪不会。是这个意思吗？那我就没办法了，对吧，我问大家会不会你也不扣一，然后呢，我问你有什么问题，你也不说，那我就帮不到你了，我就没办法了，好吧，好，那如果说你有问题再单独找我，行，这是我们所看到的，最终我们做了他俩的对比，也就是说我们学完之后一定要想一想，对吧，我们到底应该选用哪种引擎，因为我们学的就这几种，那肯定在这几种当中去挑。
14:12
对吧，这个毋庸置疑，所以说我们选择的空间呢，其实比较小啊，在这个当中选呢，呃，很容易就选到正确的答案，对吧？但是呢，你选到了正确的一个引擎之后，你还得思考一下我们到底要怎么用，对吧？是这个意思啊，就跟之前我们设计key一个道理啊，我们在想存什么数据啊，用什么数据类型，然后呢。这个选定数据类型之后，我们得想一想这个K怎么设计，不光把这个想完，想完之后呢，你还得想一想用你未来怎么用对吧？因为用的话会决定了你这个东西设计的合不合理啊，需不需要这个收据量大不大对吧？需不需要做这个TTL等等一系列的问题对吧？未来主查啊，根据什么查，这个都是你要考虑的问题，一样的，在这边选择引擎的时候，你要没有最好的引擎，这是最合适的。
15:01
对吧，好，这是我们一个对比啊。

展开

我来说两句

0 条评论

登录后参与评论

作者

腾讯云开发者课程

【合辑】尚硅谷大数据项目之Flink实时数仓

（134/200）

9分56秒

001-尚硅谷-Flink实时数仓-课程介绍

440

13分30秒

002-尚硅谷-Flink实时数仓-项目介绍

490

4分56秒

003-尚硅谷-Flink实时数仓-采集模块-课程介绍

440

7分45秒

004-尚硅谷-Flink实时数仓-采集模块-数仓分层之为什么分层

370

11分14秒

005-尚硅谷-Flink实时数仓-采集模块-数仓分层之分层明细

420

17分30秒

006-尚硅谷-Flink实时数仓-采集模块-整体需求介绍

420

9分35秒

007-尚硅谷-Flink实时数仓-采集模块-离线架构分析之Sqoop&Flume

380

19分2秒

008-尚硅谷-Flink实时数仓-采集模块-离线架构分析之FlumeTairDirSource问题提出&解决

430

28分25秒

009-尚硅谷-Flink实时数仓-采集模块-离线架构分析之Kafka

400

7分55秒

010-尚硅谷-Flink实时数仓-采集模块-离线架构分析之其他

360

11分57秒

011-尚硅谷-Flink实时数仓-采集模块-实时架构分析

420

10分45秒

012-尚硅谷-Flink实时数仓-采集模块-架构对比

430

5分49秒

013-尚硅谷-Flink实时数仓-采集模块-日志数据采集之需求分析

410

5分27秒

014-尚硅谷-Flink实时数仓-采集模块-日志数据采集之MockJar包测试

490

8分13秒

015-尚硅谷-Flink实时数仓-采集模块-日志数据采集之SpringBoot简单介绍

390

17分52秒

016-尚硅谷-Flink实时数仓-采集模块-日志数据采集之SpringBoot创建项目&简单测试

410

3分45秒

017-尚硅谷-Flink实时数仓-采集模块-日志数据采集之SpringBoot创建项目&加参数测试

440

15分46秒

018-尚硅谷-Flink实时数仓-采集模块-日志数据采集之数据落盘&写入Kafka 编码

460

5分5秒

019-尚硅谷-Flink实时数仓-采集模块-日志数据采集之数据落盘&写入Kafka 本地测试

420

4分57秒

020-尚硅谷-Flink实时数仓-采集模块-日志数据采集之数据落盘&写入Kafka 单机测试

370

9分36秒

021-尚硅谷-Flink实时数仓-采集模块-日志数据采集之Nginx 介绍

480

9分5秒

022-尚硅谷-Flink实时数仓-采集模块-日志数据采集之Nginx 安装&启动

340

10分14秒

023-尚硅谷-Flink实时数仓-采集模块-日志数据采集之Nginx 配置负载均衡&测试

390

12分56秒

024-尚硅谷-Flink实时数仓-采集模块-日志数据采集之集群测试

440

5分19秒

025-尚硅谷-Flink实时数仓-采集模块-业务数据采集之建库&建表

420

10分27秒

026-尚硅谷-Flink实时数仓-采集模块-业务数据采集之FlinkCDC 什么是CDC&对比

350

11分13秒

027-尚硅谷-Flink实时数仓-采集模块-业务数据采集之FlinkCDC 介绍

430

21分33秒

028-尚硅谷-Flink实时数仓-采集模块-业务数据采集之FlinkCDC DataStream方式编码

460

10分34秒

029-尚硅谷-Flink实时数仓-采集模块-业务数据采集之FlinkCDC DataStream方式测试

460

16分54秒

030-尚硅谷-Flink实时数仓-采集模块-业务数据采集之FlinkCDC DataStreamAPI 设置CK&打包&开启集群

520

12分11秒

031-尚硅谷-Flink实时数仓-采集模块-业务数据采集之FlinkCDC DataStreamAPI 打包进行断点续传测试

520

11分43秒

032-尚硅谷-Flink实时数仓-采集模块-业务数据采集之FlinkCDC FlinkSQLAPI 编码&测试

460

13分21秒

033-尚硅谷-Flink实时数仓-采集模块-业务数据采集之FlinkCDC DataStreamAPI 自定义反序列化器格式说明

400

16分47秒

034-尚硅谷-Flink实时数仓-采集模块-业务数据采集之FlinkCDC DataStreamAPI 自定义反序列化器编码完成

420

6分14秒

035-尚硅谷-Flink实时数仓-采集模块-业务数据采集之FlinkCDC DataStreamAPI 自定义反序列化器代码测试

380

3分30秒

036-尚硅谷-Flink实时数仓-采集模块-业务数据采集之FlinkCDC DataStreamAPI&FlinkSQL对比

460

12分21秒

037-尚硅谷-Flink实时数仓-采集模块-业务数据采集之Maxwell 安装说明&测试

380

8分36秒

038-尚硅谷-Flink实时数仓-采集模块-业务数据采集之Canal 安装说明&测试

400

15分15秒

039-尚硅谷-Flink实时数仓-采集模块-业务数据采集之CDC对比

430

11分47秒

040-尚硅谷-Flink实时数仓-采集模块-业务数据采集之读取MySQL数据并写入Kafka 编码

340

4分39秒

041-尚硅谷-Flink实时数仓-采集模块-业务数据采集之读取MySQL数据并写入Kafka 测试

360

6分15秒

042-尚硅谷-Flink实时数仓-DWD&DIM-课程介绍

370

9分51秒

043-尚硅谷-Flink实时数仓-DWD&DIM-行为数据需求分析

370

8分52秒

044-尚硅谷-Flink实时数仓-DWD&DIM-行为数据思路整理&消费Kafka数据

400

8分15秒

045-尚硅谷-Flink实时数仓-DWD&DIM-行为数据将数据转换为JSON对象

350

11分22秒

046-尚硅谷-Flink实时数仓-DWD&DIM-行为数据新老用户校验

440

11分7秒

047-尚硅谷-Flink实时数仓-DWD&DIM-行为数据侧输出流&写入Kafka

340

10分45秒

048-尚硅谷-Flink实时数仓-DWD&DIM-行为数据测试

290

28分38秒

049-尚硅谷-Flink实时数仓-DWD&DIM-业务数据之需求分析

520

6分37秒

050-尚硅谷-Flink实时数仓-DWD&DIM-业务数据之代码逻辑梳理

420

5分1秒

051-尚硅谷-Flink实时数仓-DWD&DIM-业务数据之代码编写消费数据并过滤

370

4分11秒

052-尚硅谷-Flink实时数仓-DWD&DIM-业务数据之代码编写读取配置表创建广播流

330

23分15秒

053-尚硅谷-Flink实时数仓-DWD&DIM-业务数据之代码编写配置表字段分析&建表&JavaBean

470

4分47秒

054-尚硅谷-Flink实时数仓-DWD&DIM-业务数据之代码编写开启配置表Binlog并测试

360

8分34秒

055-尚硅谷-Flink实时数仓-DWD&DIM-业务数据之代码编写连接主流&广播流并分析业务逻辑

350

9分12秒

056-尚硅谷-Flink实时数仓-DWD&DIM-业务数据之代码编写创建TableProcessFunction并初始化相关参数

360

17分51秒

057-尚硅谷-Flink实时数仓-DWD&DIM-业务数据之代码编写处理广播流数据解析数据&建表

470

1分10秒

058-尚硅谷-Flink实时数仓-DWD&DIM-业务数据之代码编写处理广播流数据写入状态

320

17分10秒

059-尚硅谷-Flink实时数仓-DWD&DIM-业务数据之代码编写处理主流数据读取状态&过滤字段

350

5分15秒

060-尚硅谷-Flink实时数仓-DWD&DIM-业务数据之代码编写处理主流数据补充SinkTable&分流

400

7分17秒

061-尚硅谷-Flink实时数仓-DWD&DIM-业务数据之代码编写检查代码

330

8分20秒

062-尚硅谷-Flink实时数仓-DWD&DIM-业务数据之代码编写测试准备

400

15分20秒

063-尚硅谷-Flink实时数仓-DWD&DIM-业务数据之代码编写测试

280

27分31秒

064-尚硅谷-Flink实时数仓-DWD&DIM-业务数据之代码编写将数据写入HBase 编码

340

21分4秒

065-尚硅谷-Flink实时数仓-DWD&DIM-业务数据之代码编写将数据写入Kafka 编码

390

6分48秒

066-尚硅谷-Flink实时数仓-DWD&DIM-业务数据之整体测试环境准备

360

15分12秒

067-尚硅谷-Flink实时数仓-DWD&DIM-业务数据之整体测试测试完成

300

11分38秒

068-尚硅谷-Flink实时数仓-ODS&DWD&DIM-小总结

420

7分19秒

069-尚硅谷-Flink实时数仓-ODS&DWD&DIM-SQL分享需求说明&建表&导数据

380

30分15秒

070-尚硅谷-Flink实时数仓-ODS&DWD&DIM-SQL分享方案一

340

18分42秒

071-尚硅谷-Flink实时数仓-ODS&DWD&DIM-SQL分享方案二

340

2分12秒

072-尚硅谷-Flink实时数仓-ODS&DWD&DIM-SQL分享 HiveOnSpark Bug说明

400

16分29秒

073-尚硅谷-Flink实时数仓-DWM层-需求分析

370

9分29秒

074-尚硅谷-Flink实时数仓-DWM层-访客UV 需求分析

440

4分21秒

075-尚硅谷-Flink实时数仓-DWM层-访客UV 代码编写消费数据并转换为JSON对象

390

15分16秒

076-尚硅谷-Flink实时数仓-DWM层-访客UV 代码编写过滤数据

370

13分12秒

077-尚硅谷-Flink实时数仓-DWM层-访客UV 代码编写设置状态超时时间防止状态过大

370

8分18秒

078-尚硅谷-Flink实时数仓-DWM层-访客UV 代码测试

320

12分25秒

079-尚硅谷-Flink实时数仓-DWM层-跳出明细需求分析

360

15分32秒

080-尚硅谷-Flink实时数仓-DWM层-跳出明细代码编写

380

12分20秒

081-尚硅谷-Flink实时数仓-DWM层-跳出明细代码测试

260

7分55秒

082-尚硅谷-Flink实时数仓-DWM层-跳出明细测试

410

3分8秒

083-尚硅谷-Flink实时数仓-DWM层-跳出明细 CEP 循环模式

370

5分25秒

084-尚硅谷-Flink实时数仓-DWM层-订单宽表需求分析

360

17分21秒

085-尚硅谷-Flink实时数仓-DWM层-订单宽表双流JOIN 官方文档说明

390

9分15秒

086-尚硅谷-Flink实时数仓-DWM层-订单宽表双流JOIN 代码编写

340

12分23秒

087-尚硅谷-Flink实时数仓-DWM层-订单宽表双流JOIN 代码测试

350

11分28秒

088-尚硅谷-Flink实时数仓-DWM层-订单宽表代码编写消费Kafka数据&转换JavaBean&提取事件时间

430

9分13秒

089-尚硅谷-Flink实时数仓-DWM层-订单宽表代码编写订单与订单明细表双流JOIN

430

10分59秒

090-尚硅谷-Flink实时数仓-DWM层-订单宽表代码测试准备工作

440

5分57秒

091-尚硅谷-Flink实时数仓-DWM层-订单宽表代码测试测试完成

390

5分13秒

092-尚硅谷-Flink实时数仓-DWM层-订单宽表关联维度思路梳理

430

9分39秒

093-尚硅谷-Flink实时数仓-DWM层-订单宽表关联维度 JDBCUtil 返回值&参数说明

350

19分24秒

094-尚硅谷-Flink实时数仓-DWM层-订单宽表关联维度 JDBCUtil 查询&封装泛型对象

410

4分14秒

095-尚硅谷-Flink实时数仓-DWM层-订单宽表关联维度 JDBCUtil 测试

340

15分48秒

096-尚硅谷-Flink实时数仓-DWM层-订单宽表关联维度 DimUtil封装&优化的必要性

360

10分52秒

097-尚硅谷-Flink实时数仓-DWM层-订单宽表关联维度优化1旁路缓存思路分析

400

15分34秒

098-尚硅谷-Flink实时数仓-DWM层-订单宽表关联维度优化1旁路缓存 Redis工具类&Key的设计

430

13分40秒

099-尚硅谷-Flink实时数仓-DWM层-订单宽表关联维度优化1旁路缓存代码编写

360

100

8分29秒

100-尚硅谷-Flink实时数仓-DWM层-订单宽表关联维度优化1旁路缓存代码测试

450

101

21分20秒

101-尚硅谷-Flink实时数仓-DWM层-订单宽表回顾

390

102

14分38秒

102-尚硅谷-Flink实时数仓-DWM层-订单宽表关联维度优化2 异步IO说明

370

103

4分51秒

103-尚硅谷-Flink实时数仓-DWM层-订单宽表关联维度优化2 异步IO编码步骤

380

104

22分31秒

104-尚硅谷-Flink实时数仓-DWM层-订单宽表关联维度优化2 异步IO编码初始化函数

410

105

23分57秒

105-尚硅谷-Flink实时数仓-DWM层-订单宽表关联维度优化2 异步IO编码异步函数完成

370

106

17分43秒

106-尚硅谷-Flink实时数仓-DWM层-订单宽表关联维度优化2 异步IO编码测试准备

360

107

9分52秒

107-尚硅谷-Flink实时数仓-DWM层-订单宽表关联维度优化2 异步IO编码测试完成

390

108

8分35秒

108-尚硅谷-Flink实时数仓-DWM层-订单宽表关联维度补充其他维度信息

370

109

4分45秒

109-尚硅谷-Flink实时数仓-DWM层-订单宽表最终测试

380

110

6分35秒

110-尚硅谷-Flink实时数仓-DWM层-订单宽表不丢维度数据说明

440

111

9分30秒

111-尚硅谷-Flink实时数仓-DWM层-支付宽表需求分析

260

112

15分49秒

112-尚硅谷-Flink实时数仓-DWM层-支付宽表代码编写

380

113

8分39秒

113-尚硅谷-Flink实时数仓-DWM层-支付宽表代码测试

350

114

7分35秒

114-尚硅谷-Flink实时数仓-DWM层-支付宽表时间工具类说明

400

115

5分29秒

115-尚硅谷-Flink实时数仓-DWS层-课程介绍

390

116

13分43秒

116-尚硅谷-Flink实时数仓-DWS层-访客主题宽表需求分析

300

117

13分1秒

117-尚硅谷-Flink实时数仓-DWS层-访客主题宽表思路整理&读取Kafka数据

460

118

17分10秒

118-尚硅谷-Flink实时数仓-DWS层-访客主题宽表处理输出流&union&提取时间戳分组

370

119

18分2秒

119-尚硅谷-Flink实时数仓-DWS层-访客主题宽表开窗&聚合

330

120

17分13秒

120-尚硅谷-Flink实时数仓-DWS层-访客主题宽表打印测试

400

121

3分42秒

121-尚硅谷-Flink实时数仓-DWS层-ClickHouse 课程介绍

360

122

13分10秒

122-尚硅谷-Flink实时数仓-DWS层-ClickHouse 概述&特点

350

123

5分43秒

123-尚硅谷-Flink实时数仓-DWS层-ClickHouse 安装准备工作

330

124

10分23秒

124-尚硅谷-Flink实时数仓-DWS层-ClickHouse 安装&启动

390

125

16分47秒

125-尚硅谷-Flink实时数仓-DWS层-ClickHouse 数据类型

390

126

4分32秒

126-尚硅谷-Flink实时数仓-DWS层-ClickHouse 简单引擎介绍

390

127

10分32秒

127-尚硅谷-Flink实时数仓-DWS层-ClickHouse MergeTree

400

128

6分1秒

128-尚硅谷-Flink实时数仓-DWS层-ClickHouse MergeTree之Partition By

380

129

5分44秒

129-尚硅谷-Flink实时数仓-DWS层-ClickHouse MergeTree之Primary Key

340

130

4分19秒

130-尚硅谷-Flink实时数仓-DWS层-ClickHouse MergeTree之Order By

340

131

5分26秒

131-尚硅谷-Flink实时数仓-DWS层-ClickHouse MergeTree之TTL

340

132

7分52秒

132-尚硅谷-Flink实时数仓-DWS层-ClickHouse ReplacingMergeTree

410

133

6分20秒

133-尚硅谷-Flink实时数仓-DWS层-ClickHouse SummingMergeTree

380

134

15分4秒

134-尚硅谷-Flink实时数仓-DWS层-ClickHouse 引擎选择分析

340

135

13分39秒

135-尚硅谷-Flink实时数仓-DWS层-ClickHouse SQL操作一

310

136

23分2秒

136-尚硅谷-Flink实时数仓-DWS层-ClickHouse SQL操作二

330

137

11分14秒

137-尚硅谷-Flink实时数仓-DWS层-ClickHouse 副本机制

400

138

7分59秒

138-尚硅谷-Flink实时数仓-DWS层-ClickHouse 分片机制说明

350

139

13分19秒

139-尚硅谷-Flink实时数仓-DWS层-ClickHouse 分片机制实操

360

140

13分16秒

140-尚硅谷-Flink实时数仓-DWS层-访客主题 ClickHouseUtil 创建

400

141

12分8秒

141-尚硅谷-Flink实时数仓-DWS层-访客主题 ClickHouseUtil 封装

330

142

18分28秒

142-尚硅谷-Flink实时数仓-DWS层-访客主题 ClickHouseUtil 封装完成

410

143

9分24秒

143-尚硅谷-Flink实时数仓-DWS层-访客主题 ClickHouseUtil 测试完成

400

144

32分3秒

144-尚硅谷-Flink实时数仓-DWS层-商品主题需求分析

390

145

8分30秒

145-尚硅谷-Flink实时数仓-DWS层-商品主题 JavaBean说明

350

146

7分51秒

146-尚硅谷-Flink实时数仓-DWS层-商品主题代码编写思路整理&消费数据创建流

360

147

17分2秒

147-尚硅谷-Flink实时数仓-DWS层-商品主题代码编写处理页面日志&收藏数据&购物车数据

380

148

7分54秒

148-尚硅谷-Flink实时数仓-DWS层-商品主题代码编写处理订单&支付数据

350

149

8分51秒

149-尚硅谷-Flink实时数仓-DWS层-商品主题代码编写处理退单&评价数据

440

150

9分19秒

150-尚硅谷-Flink实时数仓-DWS层-商品主题代码编写分组开窗&聚合

390

151

9分31秒

151-尚硅谷-Flink实时数仓-DWS层-商品主题代码编写关联维度&将数据写入ClickHouse

380

152

21分36秒

152-尚硅谷-Flink实时数仓-DWS层-商品主题-整体测试

410

153

5分10秒

153-尚硅谷-Flink实时数仓-DWS层-商品主题-需求分析

350

154

22分43秒

154-尚硅谷-Flink实时数仓-DWS层-商品主题代码编写创建环境&使用DDL方式读取Kafka数据

450

155

10分29秒

155-尚硅谷-Flink实时数仓-DWS层-商品主题代码编写分组开窗聚合

370

156

7分6秒

156-尚硅谷-Flink实时数仓-DWS层-商品主题代码编写将动态表转换为流并打印

280

157

11分22秒

157-尚硅谷-Flink实时数仓-DWS层-商品主题代码编写将数据写入ClickHouse&测试

370

158

4分21秒

158-尚硅谷-Flink实时数仓-DWS层-关键词主题需求分析

360

159

9分51秒

159-尚硅谷-Flink实时数仓-DWS层-关键词主题代码编写分词工具类封装

360

160

12分0秒

160-尚硅谷-Flink实时数仓-DWS层-关键词主题代码编写分词UDTF

370

161

16分57秒

161-尚硅谷-Flink实时数仓-DWS层-关键词主题代码编写思路分析&读取数据&建表

410

162

10分55秒

162-尚硅谷-Flink实时数仓-DWS层-关键词主题代码编写分词&开窗聚合

390

163

9分10秒

163-尚硅谷-Flink实时数仓-DWS层-关键词主题代码编写动态表转换为流&写入ClickHouse

260

164

4分6秒

164-尚硅谷-Flink实时数仓-DWS层-关键词主题代码测试

340

165

7分35秒

165-尚硅谷-Flink实时数仓-数据可视化-课程介绍

410

166

4分9秒

166-尚硅谷-Flink实时数仓-数据可视化-Sugar 创建大屏

460

167

4分11秒

167-尚硅谷-Flink实时数仓-数据可视化-Sugar 使用步骤介绍

430

168

5分9秒

168-尚硅谷-Flink实时数仓-数据可视化-数据接口项目构建

400

169

10分0秒

169-尚硅谷-Flink实时数仓-数据可视化-数据接口依赖导入&分层说明

360

170

5分0秒

170-尚硅谷-Flink实时数仓-数据可视化-数据接口 GMV接口 Mapper完成

450

171

9分17秒

171-尚硅谷-Flink实时数仓-数据可视化-数据接口 GMV接口 Service&Controller完成

380

172

3分50秒

172-尚硅谷-Flink实时数仓-数据可视化-数据接口 GMV接口测试

440

173

13分58秒

173-尚硅谷-Flink实时数仓-数据可视化-数据接口 GMV接口对接Sugar

370

174

12分40秒

174-尚硅谷-Flink实时数仓-数据可视化-数据接口品牌GMV接口 Mapper完成

390

175

5分40秒

175-尚硅谷-Flink实时数仓-数据可视化-数据接口品牌GMV接口 Service完成

330

176

3分48秒

176-尚硅谷-Flink实时数仓-数据可视化-数据接口品牌GMV接口 Controller完成

420

177

7分36秒

177-尚硅谷-Flink实时数仓-数据可视化-数据接口品牌GMV接口测试完成

320

178

3分39秒

178-尚硅谷-Flink实时数仓-数据可视化-数据接口品牌GMV接口对接Sugar

290

179

8分38秒

179-尚硅谷-Flink实时数仓-数据可视化-数据接口导入代码&品类GMV&SPU GMV

380

180

11分52秒

180-尚硅谷-Flink实时数仓-数据可视化-数据接口其他需求图表

330

181

13分29秒

181-尚硅谷-Flink实时数仓-数据可视化-最终测试

350

182

11分19秒

182-尚硅谷-Flink优化-课程介绍

430

183

14分46秒

183-尚硅谷-Flink优化-资源优化之内存设置

420

184

11分35秒

184-尚硅谷-Flink优化-资源优化之并行度设置

320

185

13分4秒

185-尚硅谷-Flink优化-资源优化之RockDB配置

330

186

4分25秒

186-尚硅谷-Flink优化-资源优化之CheckPoint配置

350

187

8分19秒

187-尚硅谷-Flink优化-资源优化之ParameterTool的介绍

410

188

26分27秒

188-尚硅谷-Flink优化-反压处理之反压介绍&定位

430

189

16分27秒

189-尚硅谷-Flink优化-反压处理之反压问题解决

390

190

2分16秒

190-尚硅谷-Flink优化-数据倾斜之定位问题

360

191

6分40秒

191-尚硅谷-Flink优化-数据倾斜之KeyBy之前的数据倾斜

390

192

18分55秒

192-尚硅谷-Flink优化-数据倾斜之KeyBy之后直接聚合

460

193

15分39秒

193-尚硅谷-Flink优化-数据倾斜之KeyBy之后开窗聚合

370

194

27分39秒

194-尚硅谷-Flink优化-KafkaSource

460

195

8分41秒

195-尚硅谷-Flink优化-FlinkSQL优化之MiniBatch

390

196

3分39秒

196-尚硅谷-Flink优化-FlinkSQL优化之LocalGlobal

430

197

3分34秒

197-尚硅谷-Flink优化-FlinkSQL优化之SplitDistinct

270

198

1分38秒

198-尚硅谷-Flink优化-FlinkSQL优化之Agg With Filter

400

199

10分8秒

199-尚硅谷-Flink优化-FlinkSQL优化之TopN优化

380

200

5分37秒

200-尚硅谷-Flink优化-FlinkSQL优化之去重方案&其他

430

134-尚硅谷-Flink实时数仓-DWS层-ClickHouse 引擎选择分析

我来说两句

作者

相关推荐

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐