文章/答案/技术大牛

发布

首页视频101-尚硅谷-Flink实时数仓-DWM层-订单宽表回顾

101-尚硅谷-Flink实时数仓-DWM层-订单宽表回顾

2022-12-022022-12-02 16:02:25播放39

点赞0 收藏 0

3.尚硅谷大数据学科--项目实战/尚硅谷大数据项目之Flink实时数仓/视频/101-尚硅谷-Flink实时数仓-DWM层-订单宽表回顾.mp4

原链接：http://www.atguigu.com/

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:00
好，那我们先把昨天的内容做一个回顾啊呃，那昨天呢，我们主要是把这个前面的内容呢，先回顾了一下，之后呢，是聊的这个订单宽表对吧？呃，那订单宽表呢，最重要的它这个逻辑线其实比较简单啊，逻辑线很简单，也就是说我们需要去消费订单表和订单明细表，这两张表呢，是事实表，我们需要对它做一个流的join引啊，我们也看了，昨天带着大家稍微的学习了一下，对吧？有这个window drawing，也有这个呃，Draw啊window draw呢叫开窗啊，窗口与窗口之间draw特别像window draw当中的这个滚动窗口的一个，照它跟它跟那个Spark streaming这边直接按批次draw非常的像。对吧，那之后呢，像还有这个滑窗照影，还有这个绘画窗口招引，绘画窗口照影，大家注意的一个点在于，呃，它是这样子的，它要等到两个流同时满足那个间隔时间，它才会关窗啊，然后把两个窗口装移在一起啊，这个也很合理，对吧，因为你要装引的话，肯定要时间上是匹配的。
01:16
啊，那如果说你直接用会话窗口，哎，不等到两个流都是同时满足的话，那它具有因为会话窗口具有时间不对齐性。所以那个照应就没法照应了。对吧？啊，那所以呢，我们这个要注意一下窗口照应，虽然我们没用啊，但是如果在工作当中你要用到的时候，你要注意一下这个事儿啊，那第二个呢，我们就看到了有in。对吧，它是有阴逗照，它就直接就相当于哎，我用一个流的一个点去join引另外一个流的一个面，对吧？啊，用这个留的一个面啊好。那。这一边转引的时候，那它我们就想啊，正常的我我这个流到这个位置了，那另外一个流上面，那肯定也是到这个点吧，对吧，它俩应该是相同的才对啊，那为什么它能够去照应到这边，也照应到这边呢？那很简单，因为在弗林格当中有状态。
02:15
对吧，那我能照到左半边，是因为你左半边的数据要保存到状态里边，那我能跟右半边也能join，那这个问题就很奇怪，对不对，那什么情况呢？那比方说那我来的时候，这后面数据肯定还没来，所以很明显是要把这条数据也要保留到状态里边，保留这么久，哎，也就是说前面数据需要保留这么长时间，后面数据呢，需要保留这么久啊，就是它需要保留这么久。对吧，所以我们看到他在我们造引的时候呢，需要写一个between，哎，负五到五啊，有一个范围对吧，当然还可以把这个边界排除掉，形成一个开区间啊，默认的是B区间，对吧，之后呢，运用一个叫process draw function就好了。
03:04
对吧，处理这个数据很简单啊好，那之后呢，我们接下来往下聊，呃，等我们双流转引完之后，我们做了一个测试，数据呢也没丢，你再往下写，如果说这个数据都没有出来，你再往下写，最后做测试肯定有问题，对吧？啊，所以呢，我们先把这个测试了，没有问题啊，那接下来呢，我们准备去写这个代码，在这边，我们当时在这写了啊。呃，在我们的这个。DWM层outy的APP，这我们写了大致的思路，对吧，那。先是获取ID，然后根据ID查询信息，然后补充信息，同样的这一套流程，这三步对吧，那我们要做地区sksk trademark category啊，总共要做这么六次啊，总共要做这么六次啊好呃，那这个时候呢。我们想那明显的访问Phoenix这个代码可以被提取出来复用。
04:05
对吧，所以我们开始呢，就写了一个这个。JDBC的一个工具类，而且我们是把它封装成一个特别通用的一个工具类，对吧，也就是说未来只要是JDBC都可以用。啊，不管你什么接力BC对吧？啊，在这里边我们传连接，传查询语句，传一个泛型类的对象，然后泛型类的类型啊，以及是否要转这个。驼峰命名啊，因为你也聊到了，在数据库当中往往都是用这个下划线命名的，那你在我们的扎病里面往往都是用驼峰命名的，所以呢，我们传一个参数可以进行一个转换，对吧，做这个事情啊好，那之后呢，在这个基础上我们又写了一个Du求。啊呃，让获取更方便，因为我们发现啊，在这个查询维度信息的时候，只有表明和我们传的这个过滤条件不一样，其他的整个circle都一样，那我们就可以封装，方便我们后续的使用，对吧？这个意思啊好，那在这个里边呢，我们开始这样写的封装circle，然后呢查询。
05:18
直接返回就好了，呃，但是在这个基础上，我们自然是测了一下，直接访问菲尼克斯呢，用我的虚拟机啊，用我的虚拟机大概是呃，13毫秒对吧，如果说你这个连接不关，大概十三十几毫秒吧，啊呃，那这个呢，我们推算了一下，它一秒钟单个平移度只能处理80条数据。80次访问对吧？啊，那这个平行度，它就是你要非常高的平行度才可以达到。这个流量高峰期的一个数值，对吧？啊，也有可能高峰的时候一千两千类似于这样子的啊。好，嗯，那之后呢，我们又想到用red做一个缓存，因为我们对这个要做优化。
06:03
对吧，所以呢，我们将做了一个缓存，那我们改写了三个地方，第一在我们查分之前，我们先查一下这个。对吧，先查啊好，那第二个问题在。查询我们的Phoenix之后，我们往去写一次啊，往去写一次，还有第三个位置啊，还有第三个位置，什么位置呢？在我们的DMC。DM当中。对吧，我们要把这个数据删掉啊，数据删掉好呃，那关于这个问题啊，这个问题有一个点，正好昨天有一个同学面试的时候，他遇到了一个问题，我给大家说一下，大家可以想一想，这个东西我们应该怎么去做一下。啊，我们怎么去做一下对吧？呃，那是什么样的一个点呢？来听着啊，现在现在我们数据是不是先。
07:05
山的。注意听啊，先删的red，这是昨天网易啊，有个学生去网易面试，然后呢，网易面试官问到的一个问题，好，我们是先删，然后再写入菲en尼斯对不对。再写入菲，那我们要做这个事情呢？主要的原因是在于保证数据一致性。对吧，我们是要保证数据的一致性，好，那这个时候呢，网易他就问了这样的一个问题，说什么问题呢，由于我们是。两个不同的进程对吧，你这个DMC的方式是是属于贝斯。D bapp，而查呢，是属于order y的PP对吧？那有没有可能这样呢？注意听啊来，呃，这边把数据删除了，好，然后这个中间总还有一点时间对吧？呃，那oy的B刚好查了一次这个数据。
08:17
啊，就是在Phoenix执行改之前，还没有修改的时候，还没有修改之前，但是已经删了，在这个之间，介于这个之间，另外一个outy的恰好查了这个数据，又把我们查的数据写到了哪。写到了。对吧，人家问的这个问题，哎，刚好呢，又把这个数据写到了，那此时red里边是不是还是老的数据啊，因为这边。是一个改操作还没有完成啊，还没有执行呢。对吧，但是呢，这一边我们又查了一次，把老数据又查出来，又写回到VE了。
09:04
那大家现在可以想一想，那怎么办嘞。想一想。啊，加个锁15。删除和写入绑定。首先第一如果用事物的是不是也要加锁，而且你要用事物的是不是得把这两个操作。
10:08
写到一起。对吧，是不是要把这两个操作写到一起啊。先写再删好呃，那如果先写再删，那删的时候出错了呢，没删掉啊。是不是也有问题啊，我写成功了，但是删除的时候这块呢，任务挂掉了，没删没删掉啊，再去访问，访问的时候是不是有问题啊，班长对吧？啊，先写也不行啊。呃，你要加加锁的，或者说事物的事物呢，也要加锁，但是我们知道在我们的这个里边，它是那种乐观锁，也就是说只要有其他的操作来了，它会释放掉这个锁。
11:03
虽然是不同的进程，但是用的是同一个工具类，加个标志位应该可以吧。不行，不同的进程工具类相同没用啊，你你两个人还能交互啊，这个肯定不行啊，那你想说事物的，或者说加锁的。写完再查询一遍。那你查没用啊，你在查的时候，那刚才我说了，中间的时候有人查了，他是把老的数据写出去了呀。对吧，呃，刚才还有一个答案说先删再改，再删一次。啊，再删一次，这种一定程度上能解决一些问题啊。还还行，这种方案就是说删两次，我等X写完之后，就是让班长说的先写再删，但是有问题，那我能不能删写删改删了我做两次。
12:05
对吧，删改删做两次就可以防止这种问题啊，但是呢，如果考虑到这个中间挂掉，因为班长说先写再删，我提出来一个点说这个任务如果挂掉，如果不考虑这个任务在中间挂掉的情况，那其实可以，对吧，先写啊这个意思再删re，这个是可以的啊呃，那如果考虑到挂掉，其实我们刚才所说的先删再改，再删其实也不好，因为如果中间挂掉了呢，那数据是不是还有问题啊，中间没删掉吗？对吧？这个没删掉，那其实可以怎么做呢？因为我们现在是针对于维度数据对不对。针对维度数据，那么呃，维度数据啊，你要记一下啊，记一下这个点，防止面试官问到，因为其实之前面试官很少问到这个事情啊，那因为我们存在这个里边呢，是一种维度数据，呃，那么这个维度数据呢，它具有一个特点是缓慢变化，也就是说维度数据更新的操作怎么样。
13:05
并不多，对不对，这是第一个点啊，要明确的，它的一个更新操作并不多，所以这一块呢，很简单，我们可以这样做，这块呢不删这块我不删，我做什么事呢，我直接把数据改了，我往去写一份。直接往写一份更新的数据。大家想这种方案是不是更好一点？对吧，呃，有的人说事物应该是最好的，我也知道事物最好的，但是你要知道在里边它是你要有事物肯定要加锁，对吧，但是呢，它是乐观所。啊，它是乐观锁不太合适吧，对吧，所以这个地方能听懂我的意思吗？这个地方这个地方本来不是删嘛，我不删了对吧，直接干什么往去写一份修改后的数据。OK，能听懂。
14:11
不删，直接更新。出错什么时候出错，你出错的意思是他写成功了，他没有写成功是吗？他成功了，他失败了，是这个意思吗？就是当前这个任务。对吧，那那你想啊，那你在查的时候。在查的时候，是不是red有最新的数据了呀，那就算这一次当前出错也没有问题呀，对吧，因为在当中这个数据我会保存24个小时。对吧，我会保存24小时，也就24个小时之内，你把数据提起来，那我们重新消费，重新消费这条数据是不是还会被写到。
15:05
还是会写进去的，这个是没有问题的。班长，能能听懂这个意思吧，班长。就是假如说他成功了，他失败了。对吧，我这个时候另外一个进程去查数据，能不能保证查的数据一定是对的呀。查到数对的吧，那你任务挂掉了，你要重启，重启之后重新消费，那这个数据是不是又被写到了，会再写一次到这个fhoi。对吧，其他同学能听懂吗？班长你这边呢，因为班长刚才说了还是一样的，如果出错了对吧，这个是没有问题问题的，这个是没有问题的对吧啊这个是比较好的一个解决方案，因为这个事物的话，你跟red去加这个东西啊，不太合适对吧呢？他乐观组啊不太合适对吧？啊，所以一般很少去启用的一个事物啊，所以呢，这边如果人家问到你的时，对吧，其实其实那个点啊很。
16:06
一般不会出现这种情况，对吧，那如果真出现了，我们可以把这块改成这个，不要去删，而是直接把数据改了就好了，对吧，把数据呢写进去啊，写进去包括班长说的那个问题也也没事儿，对吧？啊，班长说挂掉了，第一个成功了，第二个失败了啊，那没关系，因为接下来24个小时用户去访问的时候，访问这个维度的时候，这个维度是没有问题的，那你重启，重启之后呢，会把这个数据重新消费，最终呢，也会写到pix，那这样的话，保证数据的一个最终一致性，对吧，而且在中间查，有人来查这个数据的时候也没有问题，对吧？是这个意思，那这个就搞定了啊好。呃，那这是我们之前所讲的一些东西啊，那另边还有一个点，最后我们是不是看到了，哎，我问一下大家，最后咱们是不是看到这个，呃，用red之后查询的速度，只要有了再查一次一毫秒还记得吗？
17:09
还记得一毫秒这个事儿吗？没问题吧，哎，他他要他需要这个一毫秒啊呃，但是这个时候我们我们想啊，我们是有用户维度，然后呢，地区维度，呃，然后呢，还有这个什么，呃，SKU SKU trademark category。对吧，六个维度啊，至少六个维度，而且我们只查开率个三啊，如果说你要把开这个二一都查进来，就是八个维度，那我们就按六维度算啊呃，当是呢，显示一毫秒，那可能不到一毫秒，那这样呗，六个维度访问六次对不对，假如说都在red，所有数据都在缓存了，所有数据啊都在red缓存了，那我我。简算一下，我算毫秒。也就是说一条数据来了，因为一条数据要访问菲hoenix或者六次嘛，对吧，一次呢，一毫秒我全部都算在所有的数据都在ready有对吧，它是最最简约的时间啊，然后呢，也要五毫秒，五毫秒的话，那也就每秒钟咱们能处理的数据单个并度处理什么。
18:19
200条。对吧，也就是说一秒钟处理数据200条，这样的话就不会产生这个反压，如果说你要低于处理的你你的数据过来的速度超过200条，假如说300条对吧，400条这种情况，那呃，是不是产生了反压，处理不过来了嘛，就只能积攒在这个内存这块，对吧？是这个意思，好呃，那。怎么办呢？也就是说对这个内容啊，还要做优化，因为单个边路200条，这个效率太低了。对吧，单个变异度一秒钟处理200条，那你十个变异度也才2000条，对吧，100个变异度也才200条，比较低啊，这个这个处理的效率就比较低，所以对此呢，我们对这个内容还要再做优化啊，还要再做优化，因为呃，那有有的最后啊，最后你要注意我们给大家说的高峰期的数据量大概就是一千两千条啊，其实按照这个来说，我们放的就够了，但是面试官。
19:19
问你，他说你们这么小的数据量放在里不就够了吗？为什么还要用第二种优化？当然现在我还没说啊，第二种优化是什么？那这个问题大家觉得你应该怎么答？啊，考一下大家。其实假如说我们现在的数据量跟我们现在用的方案写到做旁路缓存已经完美契合了，也不会产生这个反压，对吧，然后呢，你面试的时候肯定说了你用了第二种方案嘛。
20:04
对的啊。对了，格局要大啊，对了啊，这个没问题啊，看来大家都都领会了啊，就是说咱们目光要目光放在现在还要更长远一点，对不对啊，要有格局啊，包括副总说的也没问题，我们现在正常的呢，高峰期可能是一天两天，但是我如果搞活动呢。对吧，如果我搞活动嘞，活动的时候是不是有可能也会数据量更大，对吧？啊，还有未来增长，我们数据量会增长的，我不能说稍微增长一点我就改，稍微增长一点就改，对吧，那你做测试，包括生产环境做测试啊，你可能现在假如说高峰期是2000。那你在做压测的时候，各种压测的时候，你包括卡不卡做压测对吧，大家也做过，你就是拿2000来测吗。不可能吧，对吧，起码得至少得翻个倍吧，那有的公司是五倍十倍这样去测对吧？啊，因为我们希望公司在大力的发展，对吧，所以说这个要注意一下，那也就是说接下来我们对当前这个代码再要做优化，还要做优化啊对吧。
21:18
好，那这个时候呢，我们把它截掉。

展开

我来说两句

0 条评论

登录后参与评论

作者

腾讯云开发者课程

【合辑】尚硅谷大数据项目之Flink实时数仓

（101/200）

9分56秒

001-尚硅谷-Flink实时数仓-课程介绍

440

13分30秒

002-尚硅谷-Flink实时数仓-项目介绍

490

4分56秒

003-尚硅谷-Flink实时数仓-采集模块-课程介绍

440

7分45秒

004-尚硅谷-Flink实时数仓-采集模块-数仓分层之为什么分层

370

11分14秒

005-尚硅谷-Flink实时数仓-采集模块-数仓分层之分层明细

420

17分30秒

006-尚硅谷-Flink实时数仓-采集模块-整体需求介绍

420

9分35秒

007-尚硅谷-Flink实时数仓-采集模块-离线架构分析之Sqoop&Flume

380

19分2秒

008-尚硅谷-Flink实时数仓-采集模块-离线架构分析之FlumeTairDirSource问题提出&解决

430

28分25秒

009-尚硅谷-Flink实时数仓-采集模块-离线架构分析之Kafka

400

7分55秒

010-尚硅谷-Flink实时数仓-采集模块-离线架构分析之其他

360

11分57秒

011-尚硅谷-Flink实时数仓-采集模块-实时架构分析

420

10分45秒

012-尚硅谷-Flink实时数仓-采集模块-架构对比

430

5分49秒

013-尚硅谷-Flink实时数仓-采集模块-日志数据采集之需求分析

410

5分27秒

014-尚硅谷-Flink实时数仓-采集模块-日志数据采集之MockJar包测试

490

8分13秒

015-尚硅谷-Flink实时数仓-采集模块-日志数据采集之SpringBoot简单介绍

390

17分52秒

016-尚硅谷-Flink实时数仓-采集模块-日志数据采集之SpringBoot创建项目&简单测试

410

3分45秒

017-尚硅谷-Flink实时数仓-采集模块-日志数据采集之SpringBoot创建项目&加参数测试

440

15分46秒

018-尚硅谷-Flink实时数仓-采集模块-日志数据采集之数据落盘&写入Kafka 编码

460

5分5秒

019-尚硅谷-Flink实时数仓-采集模块-日志数据采集之数据落盘&写入Kafka 本地测试

420

4分57秒

020-尚硅谷-Flink实时数仓-采集模块-日志数据采集之数据落盘&写入Kafka 单机测试

370

9分36秒

021-尚硅谷-Flink实时数仓-采集模块-日志数据采集之Nginx 介绍

480

9分5秒

022-尚硅谷-Flink实时数仓-采集模块-日志数据采集之Nginx 安装&启动

340

10分14秒

023-尚硅谷-Flink实时数仓-采集模块-日志数据采集之Nginx 配置负载均衡&测试

390

12分56秒

024-尚硅谷-Flink实时数仓-采集模块-日志数据采集之集群测试

440

5分19秒

025-尚硅谷-Flink实时数仓-采集模块-业务数据采集之建库&建表

420

10分27秒

026-尚硅谷-Flink实时数仓-采集模块-业务数据采集之FlinkCDC 什么是CDC&对比

350

11分13秒

027-尚硅谷-Flink实时数仓-采集模块-业务数据采集之FlinkCDC 介绍

430

21分33秒

028-尚硅谷-Flink实时数仓-采集模块-业务数据采集之FlinkCDC DataStream方式编码

460

10分34秒

029-尚硅谷-Flink实时数仓-采集模块-业务数据采集之FlinkCDC DataStream方式测试

460

16分54秒

030-尚硅谷-Flink实时数仓-采集模块-业务数据采集之FlinkCDC DataStreamAPI 设置CK&打包&开启集群

520

12分11秒

031-尚硅谷-Flink实时数仓-采集模块-业务数据采集之FlinkCDC DataStreamAPI 打包进行断点续传测试

520

11分43秒

032-尚硅谷-Flink实时数仓-采集模块-业务数据采集之FlinkCDC FlinkSQLAPI 编码&测试

460

13分21秒

033-尚硅谷-Flink实时数仓-采集模块-业务数据采集之FlinkCDC DataStreamAPI 自定义反序列化器格式说明

400

16分47秒

034-尚硅谷-Flink实时数仓-采集模块-业务数据采集之FlinkCDC DataStreamAPI 自定义反序列化器编码完成

420

6分14秒

035-尚硅谷-Flink实时数仓-采集模块-业务数据采集之FlinkCDC DataStreamAPI 自定义反序列化器代码测试

380

3分30秒

036-尚硅谷-Flink实时数仓-采集模块-业务数据采集之FlinkCDC DataStreamAPI&FlinkSQL对比

460

12分21秒

037-尚硅谷-Flink实时数仓-采集模块-业务数据采集之Maxwell 安装说明&测试

380

8分36秒

038-尚硅谷-Flink实时数仓-采集模块-业务数据采集之Canal 安装说明&测试

400

15分15秒

039-尚硅谷-Flink实时数仓-采集模块-业务数据采集之CDC对比

430

11分47秒

040-尚硅谷-Flink实时数仓-采集模块-业务数据采集之读取MySQL数据并写入Kafka 编码

340

4分39秒

041-尚硅谷-Flink实时数仓-采集模块-业务数据采集之读取MySQL数据并写入Kafka 测试

360

6分15秒

042-尚硅谷-Flink实时数仓-DWD&DIM-课程介绍

370

9分51秒

043-尚硅谷-Flink实时数仓-DWD&DIM-行为数据需求分析

370

8分52秒

044-尚硅谷-Flink实时数仓-DWD&DIM-行为数据思路整理&消费Kafka数据

400

8分15秒

045-尚硅谷-Flink实时数仓-DWD&DIM-行为数据将数据转换为JSON对象

350

11分22秒

046-尚硅谷-Flink实时数仓-DWD&DIM-行为数据新老用户校验

440

11分7秒

047-尚硅谷-Flink实时数仓-DWD&DIM-行为数据侧输出流&写入Kafka

340

10分45秒

048-尚硅谷-Flink实时数仓-DWD&DIM-行为数据测试

290

28分38秒

049-尚硅谷-Flink实时数仓-DWD&DIM-业务数据之需求分析

520

6分37秒

050-尚硅谷-Flink实时数仓-DWD&DIM-业务数据之代码逻辑梳理

420

5分1秒

051-尚硅谷-Flink实时数仓-DWD&DIM-业务数据之代码编写消费数据并过滤

370

4分11秒

052-尚硅谷-Flink实时数仓-DWD&DIM-业务数据之代码编写读取配置表创建广播流

330

23分15秒

053-尚硅谷-Flink实时数仓-DWD&DIM-业务数据之代码编写配置表字段分析&建表&JavaBean

470

4分47秒

054-尚硅谷-Flink实时数仓-DWD&DIM-业务数据之代码编写开启配置表Binlog并测试

360

8分34秒

055-尚硅谷-Flink实时数仓-DWD&DIM-业务数据之代码编写连接主流&广播流并分析业务逻辑

350

9分12秒

056-尚硅谷-Flink实时数仓-DWD&DIM-业务数据之代码编写创建TableProcessFunction并初始化相关参数

360

17分51秒

057-尚硅谷-Flink实时数仓-DWD&DIM-业务数据之代码编写处理广播流数据解析数据&建表

470

1分10秒

058-尚硅谷-Flink实时数仓-DWD&DIM-业务数据之代码编写处理广播流数据写入状态

320

17分10秒

059-尚硅谷-Flink实时数仓-DWD&DIM-业务数据之代码编写处理主流数据读取状态&过滤字段

350

5分15秒

060-尚硅谷-Flink实时数仓-DWD&DIM-业务数据之代码编写处理主流数据补充SinkTable&分流

400

7分17秒

061-尚硅谷-Flink实时数仓-DWD&DIM-业务数据之代码编写检查代码

330

8分20秒

062-尚硅谷-Flink实时数仓-DWD&DIM-业务数据之代码编写测试准备

400

15分20秒

063-尚硅谷-Flink实时数仓-DWD&DIM-业务数据之代码编写测试

280

27分31秒

064-尚硅谷-Flink实时数仓-DWD&DIM-业务数据之代码编写将数据写入HBase 编码

340

21分4秒

065-尚硅谷-Flink实时数仓-DWD&DIM-业务数据之代码编写将数据写入Kafka 编码

390

6分48秒

066-尚硅谷-Flink实时数仓-DWD&DIM-业务数据之整体测试环境准备

360

15分12秒

067-尚硅谷-Flink实时数仓-DWD&DIM-业务数据之整体测试测试完成

300

11分38秒

068-尚硅谷-Flink实时数仓-ODS&DWD&DIM-小总结

420

7分19秒

069-尚硅谷-Flink实时数仓-ODS&DWD&DIM-SQL分享需求说明&建表&导数据

380

30分15秒

070-尚硅谷-Flink实时数仓-ODS&DWD&DIM-SQL分享方案一

340

18分42秒

071-尚硅谷-Flink实时数仓-ODS&DWD&DIM-SQL分享方案二

340

2分12秒

072-尚硅谷-Flink实时数仓-ODS&DWD&DIM-SQL分享 HiveOnSpark Bug说明

400

16分29秒

073-尚硅谷-Flink实时数仓-DWM层-需求分析

370

9分29秒

074-尚硅谷-Flink实时数仓-DWM层-访客UV 需求分析

440

4分21秒

075-尚硅谷-Flink实时数仓-DWM层-访客UV 代码编写消费数据并转换为JSON对象

390

15分16秒

076-尚硅谷-Flink实时数仓-DWM层-访客UV 代码编写过滤数据

370

13分12秒

077-尚硅谷-Flink实时数仓-DWM层-访客UV 代码编写设置状态超时时间防止状态过大

370

8分18秒

078-尚硅谷-Flink实时数仓-DWM层-访客UV 代码测试

320

12分25秒

079-尚硅谷-Flink实时数仓-DWM层-跳出明细需求分析

360

15分32秒

080-尚硅谷-Flink实时数仓-DWM层-跳出明细代码编写

380

12分20秒

081-尚硅谷-Flink实时数仓-DWM层-跳出明细代码测试

260

7分55秒

082-尚硅谷-Flink实时数仓-DWM层-跳出明细测试

410

3分8秒

083-尚硅谷-Flink实时数仓-DWM层-跳出明细 CEP 循环模式

370

5分25秒

084-尚硅谷-Flink实时数仓-DWM层-订单宽表需求分析

360

17分21秒

085-尚硅谷-Flink实时数仓-DWM层-订单宽表双流JOIN 官方文档说明

390

9分15秒

086-尚硅谷-Flink实时数仓-DWM层-订单宽表双流JOIN 代码编写

340

12分23秒

087-尚硅谷-Flink实时数仓-DWM层-订单宽表双流JOIN 代码测试

350

11分28秒

088-尚硅谷-Flink实时数仓-DWM层-订单宽表代码编写消费Kafka数据&转换JavaBean&提取事件时间

430

9分13秒

089-尚硅谷-Flink实时数仓-DWM层-订单宽表代码编写订单与订单明细表双流JOIN

430

10分59秒

090-尚硅谷-Flink实时数仓-DWM层-订单宽表代码测试准备工作

440

5分57秒

091-尚硅谷-Flink实时数仓-DWM层-订单宽表代码测试测试完成

390

5分13秒

092-尚硅谷-Flink实时数仓-DWM层-订单宽表关联维度思路梳理

430

9分39秒

093-尚硅谷-Flink实时数仓-DWM层-订单宽表关联维度 JDBCUtil 返回值&参数说明

350

19分24秒

094-尚硅谷-Flink实时数仓-DWM层-订单宽表关联维度 JDBCUtil 查询&封装泛型对象

410

4分14秒

095-尚硅谷-Flink实时数仓-DWM层-订单宽表关联维度 JDBCUtil 测试

340

15分48秒

096-尚硅谷-Flink实时数仓-DWM层-订单宽表关联维度 DimUtil封装&优化的必要性

360

10分52秒

097-尚硅谷-Flink实时数仓-DWM层-订单宽表关联维度优化1旁路缓存思路分析

400

15分34秒

098-尚硅谷-Flink实时数仓-DWM层-订单宽表关联维度优化1旁路缓存 Redis工具类&Key的设计

430

13分40秒

099-尚硅谷-Flink实时数仓-DWM层-订单宽表关联维度优化1旁路缓存代码编写

360

100

8分29秒

100-尚硅谷-Flink实时数仓-DWM层-订单宽表关联维度优化1旁路缓存代码测试

450

101

21分20秒

101-尚硅谷-Flink实时数仓-DWM层-订单宽表回顾

390

102

14分38秒

102-尚硅谷-Flink实时数仓-DWM层-订单宽表关联维度优化2 异步IO说明

370

103

4分51秒

103-尚硅谷-Flink实时数仓-DWM层-订单宽表关联维度优化2 异步IO编码步骤

380

104

22分31秒

104-尚硅谷-Flink实时数仓-DWM层-订单宽表关联维度优化2 异步IO编码初始化函数

410

105

23分57秒

105-尚硅谷-Flink实时数仓-DWM层-订单宽表关联维度优化2 异步IO编码异步函数完成

370

106

17分43秒

106-尚硅谷-Flink实时数仓-DWM层-订单宽表关联维度优化2 异步IO编码测试准备

360

107

9分52秒

107-尚硅谷-Flink实时数仓-DWM层-订单宽表关联维度优化2 异步IO编码测试完成

390

108

8分35秒

108-尚硅谷-Flink实时数仓-DWM层-订单宽表关联维度补充其他维度信息

370

109

4分45秒

109-尚硅谷-Flink实时数仓-DWM层-订单宽表最终测试

380

110

6分35秒

110-尚硅谷-Flink实时数仓-DWM层-订单宽表不丢维度数据说明

440

111

9分30秒

111-尚硅谷-Flink实时数仓-DWM层-支付宽表需求分析

260

112

15分49秒

112-尚硅谷-Flink实时数仓-DWM层-支付宽表代码编写

380

113

8分39秒

113-尚硅谷-Flink实时数仓-DWM层-支付宽表代码测试

350

114

7分35秒

114-尚硅谷-Flink实时数仓-DWM层-支付宽表时间工具类说明

400

115

5分29秒

115-尚硅谷-Flink实时数仓-DWS层-课程介绍

390

116

13分43秒

116-尚硅谷-Flink实时数仓-DWS层-访客主题宽表需求分析

300

117

13分1秒

117-尚硅谷-Flink实时数仓-DWS层-访客主题宽表思路整理&读取Kafka数据

460

118

17分10秒

118-尚硅谷-Flink实时数仓-DWS层-访客主题宽表处理输出流&union&提取时间戳分组

370

119

18分2秒

119-尚硅谷-Flink实时数仓-DWS层-访客主题宽表开窗&聚合

330

120

17分13秒

120-尚硅谷-Flink实时数仓-DWS层-访客主题宽表打印测试

400

121

3分42秒

121-尚硅谷-Flink实时数仓-DWS层-ClickHouse 课程介绍

360

122

13分10秒

122-尚硅谷-Flink实时数仓-DWS层-ClickHouse 概述&特点

350

123

5分43秒

123-尚硅谷-Flink实时数仓-DWS层-ClickHouse 安装准备工作

330

124

10分23秒

124-尚硅谷-Flink实时数仓-DWS层-ClickHouse 安装&启动

390

125

16分47秒

125-尚硅谷-Flink实时数仓-DWS层-ClickHouse 数据类型

390

126

4分32秒

126-尚硅谷-Flink实时数仓-DWS层-ClickHouse 简单引擎介绍

390

127

10分32秒

127-尚硅谷-Flink实时数仓-DWS层-ClickHouse MergeTree

400

128

6分1秒

128-尚硅谷-Flink实时数仓-DWS层-ClickHouse MergeTree之Partition By

380

129

5分44秒

129-尚硅谷-Flink实时数仓-DWS层-ClickHouse MergeTree之Primary Key

340

130

4分19秒

130-尚硅谷-Flink实时数仓-DWS层-ClickHouse MergeTree之Order By

340

131

5分26秒

131-尚硅谷-Flink实时数仓-DWS层-ClickHouse MergeTree之TTL

340

132

7分52秒

132-尚硅谷-Flink实时数仓-DWS层-ClickHouse ReplacingMergeTree

410

133

6分20秒

133-尚硅谷-Flink实时数仓-DWS层-ClickHouse SummingMergeTree

380

134

15分4秒

134-尚硅谷-Flink实时数仓-DWS层-ClickHouse 引擎选择分析

340

135

13分39秒

135-尚硅谷-Flink实时数仓-DWS层-ClickHouse SQL操作一

310

136

23分2秒

136-尚硅谷-Flink实时数仓-DWS层-ClickHouse SQL操作二

330

137

11分14秒

137-尚硅谷-Flink实时数仓-DWS层-ClickHouse 副本机制

400

138

7分59秒

138-尚硅谷-Flink实时数仓-DWS层-ClickHouse 分片机制说明

350

139

13分19秒

139-尚硅谷-Flink实时数仓-DWS层-ClickHouse 分片机制实操

360

140

13分16秒

140-尚硅谷-Flink实时数仓-DWS层-访客主题 ClickHouseUtil 创建

400

141

12分8秒

141-尚硅谷-Flink实时数仓-DWS层-访客主题 ClickHouseUtil 封装

330

142

18分28秒

142-尚硅谷-Flink实时数仓-DWS层-访客主题 ClickHouseUtil 封装完成

410

143

9分24秒

143-尚硅谷-Flink实时数仓-DWS层-访客主题 ClickHouseUtil 测试完成

400

144

32分3秒

144-尚硅谷-Flink实时数仓-DWS层-商品主题需求分析

390

145

8分30秒

145-尚硅谷-Flink实时数仓-DWS层-商品主题 JavaBean说明

350

146

7分51秒

146-尚硅谷-Flink实时数仓-DWS层-商品主题代码编写思路整理&消费数据创建流

360

147

17分2秒

147-尚硅谷-Flink实时数仓-DWS层-商品主题代码编写处理页面日志&收藏数据&购物车数据

380

148

7分54秒

148-尚硅谷-Flink实时数仓-DWS层-商品主题代码编写处理订单&支付数据

350

149

8分51秒

149-尚硅谷-Flink实时数仓-DWS层-商品主题代码编写处理退单&评价数据

440

150

9分19秒

150-尚硅谷-Flink实时数仓-DWS层-商品主题代码编写分组开窗&聚合

390

151

9分31秒

151-尚硅谷-Flink实时数仓-DWS层-商品主题代码编写关联维度&将数据写入ClickHouse

380

152

21分36秒

152-尚硅谷-Flink实时数仓-DWS层-商品主题-整体测试

410

153

5分10秒

153-尚硅谷-Flink实时数仓-DWS层-商品主题-需求分析

350

154

22分43秒

154-尚硅谷-Flink实时数仓-DWS层-商品主题代码编写创建环境&使用DDL方式读取Kafka数据

450

155

10分29秒

155-尚硅谷-Flink实时数仓-DWS层-商品主题代码编写分组开窗聚合

370

156

7分6秒

156-尚硅谷-Flink实时数仓-DWS层-商品主题代码编写将动态表转换为流并打印

280

157

11分22秒

157-尚硅谷-Flink实时数仓-DWS层-商品主题代码编写将数据写入ClickHouse&测试

370

158

4分21秒

158-尚硅谷-Flink实时数仓-DWS层-关键词主题需求分析

360

159

9分51秒

159-尚硅谷-Flink实时数仓-DWS层-关键词主题代码编写分词工具类封装

360

160

12分0秒

160-尚硅谷-Flink实时数仓-DWS层-关键词主题代码编写分词UDTF

370

161

16分57秒

161-尚硅谷-Flink实时数仓-DWS层-关键词主题代码编写思路分析&读取数据&建表

410

162

10分55秒

162-尚硅谷-Flink实时数仓-DWS层-关键词主题代码编写分词&开窗聚合

390

163

9分10秒

163-尚硅谷-Flink实时数仓-DWS层-关键词主题代码编写动态表转换为流&写入ClickHouse

260

164

4分6秒

164-尚硅谷-Flink实时数仓-DWS层-关键词主题代码测试

340

165

7分35秒

165-尚硅谷-Flink实时数仓-数据可视化-课程介绍

410

166

4分9秒

166-尚硅谷-Flink实时数仓-数据可视化-Sugar 创建大屏

460

167

4分11秒

167-尚硅谷-Flink实时数仓-数据可视化-Sugar 使用步骤介绍

430

168

5分9秒

168-尚硅谷-Flink实时数仓-数据可视化-数据接口项目构建

400

169

10分0秒

169-尚硅谷-Flink实时数仓-数据可视化-数据接口依赖导入&分层说明

360

170

5分0秒

170-尚硅谷-Flink实时数仓-数据可视化-数据接口 GMV接口 Mapper完成

450

171

9分17秒

171-尚硅谷-Flink实时数仓-数据可视化-数据接口 GMV接口 Service&Controller完成

380

172

3分50秒

172-尚硅谷-Flink实时数仓-数据可视化-数据接口 GMV接口测试

440

173

13分58秒

173-尚硅谷-Flink实时数仓-数据可视化-数据接口 GMV接口对接Sugar

370

174

12分40秒

174-尚硅谷-Flink实时数仓-数据可视化-数据接口品牌GMV接口 Mapper完成

390

175

5分40秒

175-尚硅谷-Flink实时数仓-数据可视化-数据接口品牌GMV接口 Service完成

330

176

3分48秒

176-尚硅谷-Flink实时数仓-数据可视化-数据接口品牌GMV接口 Controller完成

420

177

7分36秒

177-尚硅谷-Flink实时数仓-数据可视化-数据接口品牌GMV接口测试完成

320

178

3分39秒

178-尚硅谷-Flink实时数仓-数据可视化-数据接口品牌GMV接口对接Sugar

290

179

8分38秒

179-尚硅谷-Flink实时数仓-数据可视化-数据接口导入代码&品类GMV&SPU GMV

380

180

11分52秒

180-尚硅谷-Flink实时数仓-数据可视化-数据接口其他需求图表

330

181

13分29秒

181-尚硅谷-Flink实时数仓-数据可视化-最终测试

350

182

11分19秒

182-尚硅谷-Flink优化-课程介绍

430

183

14分46秒

183-尚硅谷-Flink优化-资源优化之内存设置

420

184

11分35秒

184-尚硅谷-Flink优化-资源优化之并行度设置

320

185

13分4秒

185-尚硅谷-Flink优化-资源优化之RockDB配置

330

186

4分25秒

186-尚硅谷-Flink优化-资源优化之CheckPoint配置

350

187

8分19秒

187-尚硅谷-Flink优化-资源优化之ParameterTool的介绍

410

188

26分27秒

188-尚硅谷-Flink优化-反压处理之反压介绍&定位

430

189

16分27秒

189-尚硅谷-Flink优化-反压处理之反压问题解决

390

190

2分16秒

190-尚硅谷-Flink优化-数据倾斜之定位问题

360

191

6分40秒

191-尚硅谷-Flink优化-数据倾斜之KeyBy之前的数据倾斜

390

192

18分55秒

192-尚硅谷-Flink优化-数据倾斜之KeyBy之后直接聚合

460

193

15分39秒

193-尚硅谷-Flink优化-数据倾斜之KeyBy之后开窗聚合

370

194

27分39秒

194-尚硅谷-Flink优化-KafkaSource

460

195

8分41秒

195-尚硅谷-Flink优化-FlinkSQL优化之MiniBatch

390

196

3分39秒

196-尚硅谷-Flink优化-FlinkSQL优化之LocalGlobal

430

197

3分34秒

197-尚硅谷-Flink优化-FlinkSQL优化之SplitDistinct

270

198

1分38秒

198-尚硅谷-Flink优化-FlinkSQL优化之Agg With Filter

400

199

10分8秒

199-尚硅谷-Flink优化-FlinkSQL优化之TopN优化

380

200

5分37秒

200-尚硅谷-Flink优化-FlinkSQL优化之去重方案&其他

430

101-尚硅谷-Flink实时数仓-DWM层-订单宽表回顾

我来说两句

作者

相关推荐

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

101-尚硅谷-Flink实时数仓-DWM层-订单宽表 回顾

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

101-尚硅谷-Flink实时数仓-DWM层-订单宽表回顾