文章/答案/技术大牛

发布

首页视频186-实时数仓总结-DWS&ADS层

186-实时数仓总结-DWS&ADS层

2022-12-022022-12-02 16:02:26播放38

点赞0 收藏 0

3.尚硅谷大数据学科--项目实战/尚硅谷大数据项目之Flink实时数仓3.0/视频/186-实时数仓总结-DWS&ADS层.mp4

原链接：http://www.atguigu.com/

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:00
好，那接下来呢是DWS，那DWS呢，我们主要说了两个需求就够了，嗯，一个呢是关键词。需求，因为我们需求比较多，对吧，根据那个事实来的嘛，因为还是一样的，你实时表那有哪些，这边的需求就会有很多，当然整个的是根据这个指标体系建设啊，因为它需要在指标体系建设里边，我们需要把这个衍生指标。抽取出来。对吧，把这个原子指标以及这个统计周期啊，诶。统计力度相同的需求，把它拎出来设计成一张大的表，对吧，设计成一张大的表，因为你最后的指标它是有这个。嗯，除了刚才我们所说的几个，还是还有一个业务限定啊，对吧，那我们在建DWSM表的时候，就不不考虑这个业务限定业务，业务限定呢，是一个V字段，那是最终你查的时候，比如说最后。
01:00
我去我去查这个。表形成形成我们的什么，形成我们可视化那个图的时候，那我是不是分s PU trademark各种各样的，但是我在建这个DWS表的时候，是不是把这个s PU trademark什么categy全部都怼到一张表里边，大家记得吗？对吧，是这样的一个情况啊好，那第一个关键词需求。啊，关键词需求啊，那指标体系建设到了后面，我们下午再聊在离线收仓里边啊，那关键词需求呢，我们主要的用的是circle。啊，那就是提取时间，时间。太重。对吧，呃，自定义。UD。TF函数。对吧，还有那个IK分词器的使用，对吧，这个需求我们要单拎出来，因为在DW层只有这一个用的是S。
02:01
啊，所以你要去关注一下这个东西，那后面还有一个是什么呢。不用想，就是最复杂的那个需求了。啊，就是用户。商品力度。下单。对吧，下单的一个业务逻辑啊呃，那为什么要抽取它来聊呢？最关键的还不是在于关联微调操作吧，最重要的诶，那我们把它拎出来是因为它，而不是说它里边有多张表啊啊去怎么怎么做啊，倒不是的，就是关联维表操作。对吧，这块呢，首先我们写了一个Phoenix。啊，或者说叫JDBC啊。悠久对吧，这个呢，倒还行吧，倒还正常对吧，只不过说呢有点复杂，因为我们里面用到了这个泛型啊，用到了这个泛型对吧？好，那之后呢，我们把它又进行了一个封装，封装了一个DMMU，因为我们发现在当前这个项目当中，我们要查的数据，所有的搜狗写出来都一样，都是谁select，新from t where ID等于A什么什么什么。
03:14
对吧，所有的数据都是这样子的，所以呢，我们就又封装了一层啊，那正常的去做这个处理，但是呢，在我们测试的时候，测试发现延迟过高。对吧，所以呢，我们有了第一次优化。优化一。对吧，U1呢用的是旁雾。缓存缓存这里面有这几个点，第一，缓存的选择。啊，有这个堆缓存。哎。有堆缓存，有独立。缓存服务。
04:01
对吧，对于缓存呢，就是我们说的你在本地的开关内存它呢，嗯，效率高。对吧，延迟低。啊，那独立缓存服务呢，你至少是一个服务，你呢要去连接效率肯定不如我对于缓存好啊，那独立缓存服务没有好处吗？便于维护对吧，可复用可复用可修改可删除。啊比较方便对吧，那你堆不好，你呢写在代码里边的，那我其他人再来访问，我只能再自己创建一个，我没法用你的，很麻烦。对吧，那很明显我们的维表这个东西缓存过来，维表肯定要被复用嘛，对吧，所以最终呢，我们还是选择独立缓存服务，因为我们那个数据还得更新。还得修改对吧？啊，那如果不更新呢，你用这个对缓存也还好点啊，那你还要更新还要修改啊，那不行对吧？啊，那所以呢，选择就搞定了，然后呢，我们做了三件事，第一。读缓存。
05:01
对吧，缓存没读到不费那斯，然后呢写缓存。啊，最后还有一个数据更新时。删除缓存对吧，我们做了三件事，但是这里边有一个点，我这个东西呢，我要跟你详细的说一说啊，就是之前呢，呃，没有细说啊，这个呢，在面试的时候呢，也会聊，就是数据更新，哎，呃，那我们想啊，这边呢有两个，有两个情况就是数据更新的时候，那比如说啊，我们在这边写一下数据更新时有两件事要做一个，哪两件事呢，将。更新的数据。写入。Phoenix还有一件事对吧，删除。数据。好，那呃，你现在去思考一下这个东西呢，我们。
06:01
这两个操作啊，它是跨两个系统对吧，没办法一起操作了，有一前一后，那谁先谁后会更好一点呢。就是先去写Phoenix好还是先删好呢？嗯。想一想啊。我们应该。怎么做嘞？你觉得你现在去思考一下对吧？好，假如说呢，两种情况先。这个啊。他有可能会出现什么样的问题，对吧，或者说呢，用这个。
07:07
先删除。在这个好，那我们想一下啊，呃，比如说我呢，更新的时候我先写到Phoenix。晒SHRA，那嗯，他是这样子的，这种两个操作呢，就跟我们消费卡不卡数据一样，一个提交一个提交数据对吧，一前一后，那如果两个都失败了，或者两个都成功了，那没有问题。对吧，好，那我们要考虑的是一个成功，一个失败，那你这种是串联的吧，有没有并行对吧，就是说先做它再做它，那做完了之后再做它，所以呢，那要成功也是前面先成功，后面失败，对吧，比如说。呃，先写菲尼克斯成功了。失败了。
08:01
好，假如说这个修改操作，本来呢，两边都是小写的A。啊好，那我呢，在MY里边改了一下，我把小写的A啊改成大写，它不是有更新操作嘛，对吧，我发现更新操作呢，我把这个地方改成了A，但这没改掉没删掉，没删掉的时候，我用户访问数据，我就关联为表，是不是关联它是小A啊感觉这种不太靠谱吧，因为你成功了，你失败了会导致数据不一致，对吧？好，那这种呢。如果是这种呢？对吧，如果是他呢。它的话我们来想一下啊呃，那还是一样的，两个呢都是小A啊，然后呢，我把小A呢变成大A了。变成大A了对吧，好，那我先把它删掉了。我先把它删掉了，删掉以后呢，成功了，对吧，但是他改失败了，那改失败了，最后呢，最终啊，肯定还是重新改嘛，因为这个数据失败了，包括这个也一样啊，上面这个一样，因为你这条数据没有成功，没有成功你挂掉了对吧，你还会重新消费，因为卡夫卡嘛，重新消费最终呢会改成功，但这个就没问题了，对吧，因为呢，你怎么样。
09:14
你先删了。然后呢？再去改，假如说第一次没改掉，那也没关系啊。对吧，好，那这种看上去啊，这种看上去是不是要比这种要好一些。能理解吗？这个是不是直接导致数据不一致啊，关键的是之前有一个学生在面试的时候。面试官是怎么问的呢？他说因为我们课堂上写的就是这种，你可以去翻一下啊，我写的是这种先删red数据再去写非你可以翻一下代码用的这种方式，这个面试官呢，就提出来这个问题，他说当你删除成功以后啊，我也不是说这个第二个失败了，也没有失败也能写出去。啊也能写成功，更新成功，但是呢，你把这个A改成大A嘛，就更新出去，对吧，在这个中间。
10:04
我有一次查。这个面试官问的问题还挺刁钻的啊，就是当你删成功了。我呢，这个数据被查了一次，他会怎么样，那我还没有更新啊，注意还没有更新，在在你更新数据之前，我查了一次，他查到的是不是还是小A，小A又把它写到red了，诶你刚删的怎么样，又写回来了，嗯，最后呢，又改成功了，诶这边是大A，这边小A。毁了。是不是数据又不一致了？对吧，还挺刁钻的，那如果说这种问题我们该怎么解决呢？人麻了。
11:01
嗯，面试官。还蛮刁钻的，大家说是不是？啊，挺刁钻的。保存一次，对了。对了，就是整个的呢，锁这咱们加锁跨系统诶。跨系统啊，就是啊。再来一次。有同学说，这样。这种方案行不行？再来一次。对吧，我再删一次，我延迟双删这种方案啊，叫延迟双删这个行不行呢，其实这种也不行，为什么。因为当你这成功了，然后呢，在这查了一次，又变成小A，好，那就变成了什么。退化到了这种情况。假如说你成功了，失败了呢，又不是不是又不一致不行对吧，所以怎么做呢？这里边有个最好的处理方案，就是不要删除，当更数据更新时。
12:00
啊，但是这种呢。就麻烦一点，因为数据大小写的问题啊，会比较麻烦一点，当数据更新时。干什么呢，先。将。更新的。啊，直接把添加数据，因为我们说了更新了对吧，肯定是更新的数据啊先。将数据。直接写入，注意啊，写入啊在。将数据。写入F，我不删，直接写。啊，我直接往ready写最新的数据，哪怕你先写ready成功了，再写入非利失败了，我都不不不用担心，对吧，因为你比如说现在呢，你俩都是A好，那我A呢变成大A，我把数据改了，改了之后呢，先改ready就改啊对吧，写它不是覆盖吗？用的string覆盖好变成大A，哪怕你第二步操作挂掉了也没关系，你这个时候人来读。你这个时候人来读对吧，读的话也没关系，因为你读到的是一个大A，我有。
13:05
对吧，那就是说你这个数据不一致啊，没关系啊，你这个都失败了，失败了以后是不是挂掉，挂掉之后呢，会重新消费，重新读取吧。对吧，重新读取那会怎么样呢？哎，重新读取之后呢，最终这个是不是会变成就最终它俩一致的，而且中间有人来查也没关系。对吧，中间如果有人来查这个数据，它也没有关系，因为我呢是最新的数据。对吧，哎，得这样处理一下，那这个是之前有面试官问到的啊，所以到这块复习的时候呢，我把这个点给大家去说一说。啊，这样大家印象会更深一点，我觉得在刚开始的时候说啊，大家就懵了。啊，本身加这个独立缓存服务的时候，大家就很晕了，对吧，这一块当时写代码的时候挺痛苦的吧，我就没有把这个复杂东西呢，那个时候去说啊，在复习的时候呢。回过头来咱们就清楚了啊好，那最后呢，这个点啊，还有一个优化二。
14:04
对于当前这个需求而言。优化二对吧，咱们用的100。EBI啊，这个就没有什么太多可说的，就正常的用ebo的一个API就行了，只不过说那个函数写出来比较麻烦，因为咱们又用到了泛型。对吧，又用到了这个泛型。啊，EIO对吧，这个操作呢？啊，关键问题在于还有一个点我们需要跟大家提一下，面试官可能会问，那你这个数据量这么小对吧？啊，为什么还要用这个什么跑路缓存ebo o乱七八糟的用一堆。啊，那你是不是考虑到第一我们做压测对吧，成倍的去压测的啊第二。我们未来数据量会涨嘛，对吧？啊，这个点不能忘了啊，别一问懵了啊，还跟面试官说，诶是是是当时不知道怎么想的，不要这样对吧？嗯，有理由的咱们就可以用这些啊。
15:03
对吧，啊好，这是我们关于这个DWS层里边最重要的就是它了，尊重他了，那其他的就是窗口操作啊，刚才我们复习窗口的时候也说了，对吧？啊，怎么样去获取这个窗口时间啊，既用到增量又用到全量啊这种方式对吧？最后adsads数据接口，那这个接口里边S都比较简单一点了，因为它怎么来的。你都是从DWS里边出来的，对吧，DWS呢，已经按照十秒一聚合，十秒一聚合了，所以呢，这边就好了，对了，这个十秒一聚合我还得说一下。你面试的时候大可不必说十秒。啊，你要真要开装两三秒或者一两秒都可以。OK吧，因为毕竟是一个实时需求，咱们做十秒是没办法，没必要搞更快，对吧，我非得搞个两秒三秒没有意义啊。大家也看到了，我们当时做可视化的时候那个sugar，它对于这个大屏尝鲜版就是试用版本。
16:02
它最快的刷新频率是十秒一次，那你这个窗口两三秒你也看不到效果呀，那个大屏还是十秒钟才能看到一次效果，对吧，这意思，所以呢，你没有意义，那我们呢，可以不按照十秒聚合对吧，两三秒啊都行，就看你公司当中对于这个实时要求嘛，对吧，甚至我不做。聚合我直接把这个明细写出去，对吧，效率更高也可以啊，都没有问题对吧，ADS数据接口就是在。窗口聚合的前提下再做聚合，无非就是有一些延伸指标对吧，啊两个指标呢，求一些什么比率啊，或者类似这样子的啊，这这就这些东西对吧？好，这是我们整个的一个实时书仓里边所涉及到的东西，我们写了那么多天。对吧，因为我们的表比较多，所以呢，里边有很多是重复工作啊，挺好的重复工作，因为这样的话就是本身的这个需求，由于业务不同，本身把代码呢，就练习了很多次，对吧。

展开

我来说两句

0 条评论

登录后参与评论

作者

腾讯云开发者课程

【合辑】尚硅谷大数据项目之Flink实时数仓3.0

（185/185）

3分48秒

001_实时数仓_课程简介

500

2分38秒

002_数仓概念-数仓简介

420

11分47秒

003_数仓概念-数据分类

430

22分30秒

004_数仓概念-数仓总体介绍

430

4分48秒

005_数仓概念-项目需求分析

400

16分33秒

006_数仓概念-技术选型

390

10分53秒

007_数仓概念-系统数据流程

450

9分59秒

008_数仓概念-框架版本的选择

390

3分18秒

009_数仓概念-具体版本号选择

400

5分35秒

010_数仓概念-服务器选型

310

9分18秒

011_数仓概念-集群规模

430

2分43秒

012_数仓概念-集群资源规划

390

6分22秒

013_同步行为数据模拟-埋点简介

560

17分25秒

014_用户行为数据模拟-用户行为日志内容

520

9分32秒

015_用户行为数据模拟-埋点日志格式

650

15分56秒

016_用户行为数据模拟-克隆三台服务器

390

4分42秒

018_用户行为数据模拟-集群同步脚本

370

7分49秒

019_用户行为数据模拟-免密登录配置

350

8分54秒

020_用户行为数据模拟-安装JDK

400

4分23秒

021_用户行为数据模拟-Linux环境变量说明

420

15分32秒

022_用户行为数据模拟-模拟数据

430

58分32秒

023_用户行为数据采集-hadoop安装

340

20分6秒

024_用户行为数据采集-Hadoop项目经验

390

11分42秒

025_用户行为数据采集-Zookeeper安装

400

14分12秒

026_用户行为数据采集-Kafka安装

370

5分9秒

027_用户行为数据采集-Flume安装

380

35分53秒

028_用户行为数据采集-Flume的KafkaChannel

370

1时11分

029_用户行为数据采集-采集Flume配置

270

10分7秒

030_业务数据采集-电商业务简介

350

38分11秒

031_业务数据采集-电商业务表结构

400

23分27秒

032_业务数据采集-业务数据模拟

430

2分54秒

033_业务数据采集-业务数据通道

370

21分15秒

034_业务数据采集-Maxwell简介

350

33分26秒

035_业务数据采集-Maxwell配置

440

21分19秒

036_业务数据采集-Maxwell使用

400

3分32秒

037_业务数据采集-采集通道maxwell配置

400

2分14秒

038_实时数仓数据同步-实时数仓同步数据

470

16分43秒

039-分层介绍-离线数仓回顾

390

22分47秒

040-分层介绍-实时数仓分层-处理&存储框架概述

440

21分39秒

041-分层介绍-实时数仓分层-DIM层框架选择

440

14分40秒

042-分层介绍-实时数仓分层-DWS&ADS层框架选择

350

11分42秒

043-分层介绍-实时数仓分层-架构说明

320

16分57秒

044-建模理论-范式理论-关系型数据库

420

17分32秒

045-建模理论-维度建模-大数据数仓

420

8分32秒

046-建模理论-维度建模-事实表&维度表&构建数仓流程

400

4分48秒

047-开发环境-集群环境准备

380

9分54秒

048-开发环境-IDEA环境准备

390

4分58秒

049-ODS层-日志数据采集-测试

340

4分30秒

050-ODS层-业务数据采集-测试

370

11分58秒

051-每日回顾

390

8分33秒

052-DIM层-需求分析

410

7分19秒

053-DIM层-问题&解决思路提出

370

5分51秒

054-DIM层-优化1方案讨论

400

13分15秒

055-DIM层-优化2方案讨论

350

20分1秒

056-DIM层-优化2实施讨论

370

14分56秒

057-DIM层-思路整理

330

15分35秒

058-DIM层-代码编写-流程梳理&获取执行环境

400

15分16秒

059-DIM层-代码编写-Kafka消费者工具类封装

380

16分33秒

060-DIM层-代码编写-过滤脏数据

330

31分43秒

061-DIM层-代码编写-配置信息表-字段讨论&说明

380

10分10秒

062-DIM层-代码编写-配置信息表-准备工作

350

7分2秒

063-DIM层-代码编写-使用FlinkCDC读取配置信息表创建流

410

13分44秒

064-DIM层-代码编写-构建配置信息广播流&与主流连接

390

6分3秒

065-DIM层-代码编写-连接流处理逻辑分析

410

37分7秒

066-DIM层-代码编写-处理广播流数据

400

27分26秒

067-DIM层-代码编写-处理主流数据

420

15分58秒

068-DIM层-代码测试

320

21分39秒

069-每日回顾

340

16分22秒

070-DIM层-将数据写出-JdbcSink分析

350

12分27秒

071-DIM层-将数据写出-自定义Sink-创建连接池

350

31分16秒

072-DIM层-将数据写出-自定义Sink-拼接SQL&执行

380

13分37秒

073-DIM层-将数据写出-代码测试

320

24分54秒

074-DWD层-整体介绍&方案说明

390

15分0秒

075-DWD层-流量域-未加工事实表-需求分析

410

19分38秒

076-DWD层-流量域-未加工事实表-思路分析

400

8分54秒

077-DWD层-流量域-未加工事实表-代码编写-时间工具类

330

13分57秒

078-DWD层-流量域-未加工事实表-代码编写-消费&过滤&分组数据

350

16分15秒

079-DWD层-流量域-未加工事实表-代码编写-新老访客标记校验

270

23分3秒

080-DWD层-流量域-未加工事实表-代码编写-分流

390

20分59秒

081-DWD层-流量域-未加工事实表-写出数据&测试

370

10分40秒

082-每日回顾

440

6分59秒

083-DWD层-流量域-未加工事实表-整体测试

350

14分6秒

084-DWD层-流量域-独立访客明细表-需求分析

320

21分5秒

085-DWD层-流量域-独立访客明细表-思路分析

360

6分42秒

086-DWD层-流量域-独立访客明细表-代码编写-获取&过滤&转换数据

380

8分57秒

087-DWD层-流量域-独立访客明细表-代码编写-按照Mid去重&写出到Kafka

260

26分44秒

088-DWD层-流量域-独立访客明细表-代码编写-添加状态TTL

300

8分5秒

089-DWD层-流量域-独立访客明细表-代码测试

360

17分0秒

090-DWD层-流量域-跳出明细表-需求分析&思路一

320

13分56秒

091-DWD层-流量域-跳出明细表-思路二

330

20分21秒

092-DWD层-流量域-跳出明细表-思路三

340

28分0秒

093-DWD层-流量域-跳出明细表-代码编写

360

24分37秒

094-DWD层-流量域-跳出明细表-代码测试

380

10分1秒

095-Flink基础知识扩展-说明

420

12分46秒

096-Flink基础知识扩展-WindowJoin-介绍

350

31分22秒

097-Flink基础知识扩展-IntervalJoin

420

21分51秒

098-Flink基础知识扩展-FlinkSQLJoin-官网说明&InnerJoin编码测试

370

29分42秒

099-Flink基础知识扩展-FlinkSQLJoin-外连接测试

310

18分29秒

100-Flink基础知识扩展-FlinkSQLJoin-LookUpJoin说明&构建维表

420

100

20分46秒

101-FlinkSQLJoin-LookUpJoin编码-构建事实表&关联测试

410

101

11分12秒

102-每日回顾

370

102

7分31秒

103-DWD层-加购事实表-需求分析&思路整理

390

103

24分23秒

104-DWD层-加购事实表-DDL构建topci_db表

450

104

21分24秒

105-DWD层-加购事实表-过滤出加购数据

360

105

28分32秒

106-DWD层-加购事实表-编码完成&测试

380

106

27分23秒

107-DWD层-订单事实预处理表-需求分析&获取原始表和LookUp表

410

107

24分53秒

108-DWD层-订单事实预处理表-过滤出4张表&测试

360

108

29分55秒

109-DWD层-订单事实预处理表-关联5张表&测试

330

109

26分18秒

110-DWD层-订单事实预处理表-将数据写出&测试

300

110

18分36秒

111-每日回顾

300

111

40分2秒

112-DWD层-下单事实表

390

112

22分1秒

113-DWD层-取消订单事实表

370

113

36分56秒

114-DWD层-支付成功需求

400

114

14分34秒

115-DWD层-退单需求

280

115

17分45秒

116-DWD层-退款成功需求

360

116

21分10秒

117-DWD层-优惠券相关需求

430

117

16分56秒

118-DWD层-收藏商品、评价、用户注册需求

390

118

15分30秒

119-DWS层-整体介绍

370

119

33分4秒

120-DWS层-关键词需求-需求分析&工具类封装

260

120

33分14秒

121-DWS层-关键词需求-代码编写2

340

121

20分51秒

122-DWS层-关键词需求-代码编写-开窗聚合&ClickHouse表引擎选择

360

122

25分25秒

123-DWS层-关键词需求-编码完成&测试

340

123

7分21秒

124-每日回顾

430

124

18分4秒

125-DWS层-关键词需求-代码编写-ClickHouse建表&工具类封装-1

370

125

26分10秒

126-DWS层-关键词需求-代码编写-ClickHouse工具类封装-2

460

126

17分39秒

127-DWS层-关键词需求-代码编写-ClickHouse工具类封装-3

400

127

3分13秒

128-DWS层-关键词需求-代码最终测试

410

128

26分53秒

129-DWS层-版本渠道地区访客类别粒度页面浏览需求-需求分析&编码开始

400

129

27分11秒

130-DWS层-版本渠道地区访客类别粒度页面浏览需求-代码编写2

320

130

30分14秒

131-DWS层-版本渠道地区访客类别粒度页面浏览需求-代码测试

360

131

11分12秒

132-每日回顾

360

132

11分10秒

133-DWS层-页面浏览需求-需求分析&思路整理

360

133

8分16秒

134-DWS层-页面浏览需求-消费&转换&过滤数据

290

134

26分42秒

135-DWS层-页面浏览需求-编码完成&测试

350

135

16分44秒

136-DWS层-用户登录需求-需求分析&思路整理

450

136

29分37秒

137-DWS层-用户登录需求-编码&测试

360

137

21分41秒

138-DWS层-用户注册需求

330

138

27分27秒

139-DWS层-加购需求

390

139

6分52秒

140-每日回顾

360

140

24分56秒

141-DWS层-支付成功需求-需求分析

290

141

30分10秒

142-DWS层-支付成功需求-去重思路

290

142

32分0秒

143-DWS层-支付成功需求-思路整理&编码开始

320

143

34分42秒

144-DWS层-支付成功需求-编码完成&测试

360

144

32分7秒

145-DWS层-下单需求-需求分析&代码编写

350

145

25分35秒

146-DWS层-下单需求-编码完成&测试

370

146

13分42秒

147-每日回顾

370

147

10分38秒

148-DWS层-用户SPU粒度下单需求-需求分析-1关联维表

320

148

23分5秒

149-DWS层-用户SPU粒度下单需求-需求分析-2订单ID去重

320

149

21分16秒

150-DWS层-用户SPU粒度下单需求-需求分析-3订单ID去重

440

150

26分44秒

151-DWS层-用户SPU粒度下单需求-思路整理&代码编写

330

151

27分28秒

152-DWS层-用户SPU粒度下单需求-JDBCUtil封装开始

360

152

20分54秒

153-DWS层-用户SPU粒度下单需求-JDBCUtil封装完成&测试

430

153

17分41秒

154-DWS层-用户SPU粒度下单需求-DimUtil封装&测试

430

154

30分48秒

155-DWS层-用户SPU粒度下单需求-关联维表优化1-旁路缓存-说明

380

155

42分20秒

156-DWS层-用户SPU粒度下单需求-关联维表优化1-旁路缓存-编码&测试

340

156

17分0秒

157-每日回顾

420

157

16分20秒

158-DWS层-用户SPU粒度下单需求-优化方案2-异步IO-说明

320

158

13分57秒

159-DWS层-用户SPU粒度下单需求-优化方案2-异步IO-编码介绍

350

159

26分41秒

160-DWS层-用户SPU粒度下单需求-优化方案2-异步IO-异步函数准备工作

370

160

21分37秒

161-DWS层-用户SPU粒度下单需求-优化方案2-异步IO-获取维表信息参数讨论

310

161

17分31秒

162-DWS层-用户SPU粒度下单需求-优化方案2-异步IO-函数完成

380

162

17分50秒

163-DWS层-用户SPU粒度下单需求-优化方案2-异步IO-函数测试

380

163

33分40秒

164-DWS层-用户SPU粒度下单需求-后续&测试

300

164

38分31秒

165-DWS层-省份粒度下单需求

330

165

44分17秒

166-DWS层-品牌品类用户粒度退单需求

370

166

30分55秒

167-ADS&数据可视化层-课程介绍

330

167

31分33秒

168-ADS&数据可视化层-数据接口模块-构建

310

168

21分18秒

169-ADS&数据可视化层-数据接口模块-GMV需求-编码完成）

370

169

17分37秒

170-ADS&数据可视化层-数据接口模块-GMV需求-测试

350

170

11分15秒

171-ADS&数据可视化层-数据接口模块-渠道日活需求-需求分析

440

171

29分35秒

172-ADS&数据可视化层-数据接口模块-渠道日活需求-代码完成

320

172

16分50秒

173-ADS&数据可视化层-数据接口模块-渠道日活需求-测试完成

370

173

25分34秒

174_ADS&数据可视化层（数据接口模块测试已完成&其他需求接口）

310

174

3分5秒

175-Flink优化-课程介绍

370

175

30分37秒

176-Flink优化-资源优化

440

176

23分43秒

177-Flink优化-反压处理

360

177

14分59秒

178-Flink优化-数据倾斜-现象介绍&KeyBy前数据倾斜

520

178

18分17秒

179-Flink优化-数据倾斜-KeyBy后直接聚合

450

179

15分49秒

180-Flink优化-数据倾斜-KeyBy后开窗聚合

550

180

6分36秒

181-Flink优化-KafkaSource

490

181

21分36秒

182-Flink优化-FlinkSQL

360

182

5分2秒

183-实时数仓总结-分层

400

183

10分1秒

184-实时数仓总结-ODS&DWD层

280

184

4分33秒

185-实时数仓总结-DIM层

400

185

16分59秒

186-实时数仓总结-DWS&ADS层

380

186-实时数仓总结-DWS&ADS层

我来说两句

作者

相关推荐

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐