文章/答案/技术大牛

发布

首页视频056-DIM层-优化2实施讨论

056-DIM层-优化2实施讨论

2022-12-022022-12-02 16:02:25播放37

点赞0 收藏 0

3.尚硅谷大数据学科--项目实战/尚硅谷大数据项目之Flink实时数仓3.0/视频/056-DIM层-优化2实施讨论.mp4

原链接：http://www.atguigu.com/

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:00
好，那刚才呢，咱们聊到了优化二这种方案其实是可以实现的。对吧，是可以实现的，哎，那我们用第二种方式，第一个呢，是用定时任务，不断的每隔一段时间去加载一次，对吧，第二种方式呢，我们直接监控这个配置信息就好了。啊，因为这种方案呢，能更好一点对吧？好，那既然要这样去做，我们要思考一下具体的代码，等会儿应该怎么去写了，我们得先心里边有一个规划。对吧，嗯。定时任务这种呢，倒好写一点，因为写到open方法里边就行了，它是一个流，现在关键的问题呢，我们如果说无论是用flink CDC去读取my circle的blog，还是说用from去监控文件。用t source对吧，监控文件传到卡，然后弗link就消费形成这个对吧，它都会是一个单独的流，要注意咱们是不是还有一个消费topic DB的。
01:14
数据流啊，对吧，我们还有一个这个流。那你肯定要写一个卡夫卡吧，对吧，这是卡夫卡的S啊，那这个是弗利CDC啊，或者说呢，这也有一个卡夫卡的S。啊，它是两个不同的主题，你肯定不能说往一个主题里边扔，对吧？好，那就形成了我们有两个流，那对于这两个流我应该。怎么处理呢？两个流的操作。咱们学过有哪些呀？对于两个流的操作。还有没毛病，还有呢。
02:04
啊，跟union对吧，好嗯。那我们想一下。这个地方我们该用谁？就目前来说，我们只学过这两个，其实还有一个招引，对吧，但是招引还没有学到啊，在这个项目当中呢，由我给大家去讲这招引应该怎么去做，对吧，实施。我们在connect跟union里边，大家觉得我们应该要用哪一个，你想一想我们的需求，对吧，再想一想这个connect跟union的一个功能。啊，它俩之间的一个区别。Connect呢，它只能连接两个流对吧，啊，两两去连接。啊，UN呢，它可以多个流，但是呢。它的类型必须得是一样的，也就未来你的处理方案。
03:05
是一样的。对吧，那很明显我们这两个流的数据肯定不一样吧，对吧，虽然你可以把它UN到一起，就是说你两个都写string类型吧，是可以用到一起，但是你接下来你就不好区分。这两个数据了。对吧，就不好区分这两个数据了，因为你形成一个流，你处理方案UI以后，它就形成了一个流。这个流呢，它只有一个处理方法对吧，而connect它不是connect连接以后呢，它有两个处理方法，一个叫process element1，一个叫process element2，对吧，它两个流分开处理的。啊，分开处理的好，那很明显呢，我们要用connect啊，然后具体一点怎么做呢？比如说我用这个数据流，我们把它称为主流可以吧。主流我去连接connect啊，连接什么呢？配置流。
04:06
对吧，好，里边呢有两个方法，一个process element1，一个叫process element，二，有两个方法吧，对吧？啊，那一呢是处理主流数据的，二呢是处理配置流数据的，那我们具体的应该怎么写呢？关键问题在于我们这个地方要做过滤，对吧，它是process方法，可以做到这个过滤。啊。呃，那我们对于主流数据要做过滤过滤的。条件什么呢？来自于配置流。对吧，所以我们想啊。这个。配置流我们应该怎么处理？就是说在处理主流数据的时候，我们需要用到配置流的数据。测输出。
05:04
把配置流。写到侧输出流是吗？啊。广播。我现在就是一个普通的连接，我就是连接两个普通的流。你广播流，你只是说把这个配置流改成广播流嘛，你我现在问的是process element2这个方法里边我们应该干什么事。你你你在这里边再写一个广播流不现实吧，你要广播流只能把这玩意儿做成广播流吧，现在不是聊广播流的事儿啊，现在我问你的问题，你要听清楚问题好吧，就是说我现在处理主流数据P对吧，Process element1。
06:00
这个方法里边。我们。干什么？要根据process element2。数据来做处理，对吧？现在的问题在于PROCESS2、我要干什么事？我的问题是这个你跟我说广播流它不太现实吧，你在这里边来搞一个广播流吗？不可能对吧，还没到广播流这一步。对吧，啊。没问题啊，两同学说了配置流数据存储下来，然后呢，那个方总也说了，这个状态是不是咱们遇到配置流数据来了，我们可以把这个数据干什么写到。状态里边对吧，而这一边呢，这边注意是写状态吧，而这边呢，咱是不是去读状态。咱把这个状态给它读出来。是不是就好？
07:00
能理解这个事儿吗？就是说当配置信息来了，我把它呢保存到状态里边，这个状态呢。不设置过期时间，也不去可利亚对吧，然后。主流数据来了，我呢，从状态里边把这个数据读出来，然后去做我们的过滤，对吧，把我们要的数据给它过滤出来。能理解吗？这一步就是我们所说的事情，对吧？对于配置流而言，我们应该写状态，而对于主流。数据就是我们数据流读取topic DB这个主题的。留，我们应该干什么事呢？读取状态，然后根据状态里边的字段。来做过滤，这一步OK吗？
08:05
这一步OK吗？嗯，就三个同学啊，其他同学呢。这块有问题是吗？这里边儿我们主流去连接配置流，对吧，它就会形成两个方法。啊，第一个方法处理主流数据，因为按照顺序嘛，你如果配置流去连接它，那第一个就是处理的配置流按顺序来的，对吧，一对一二对应二，它是这样子。对吧，好，那这里边儿呢，其实存在有问题。啊，有什么问题呢？比如说我的配置信息啊，注意看啊。配置信息对吧，有A。B。我有两个表的信息啊，我要我呢，未来有abcde对吧，这些个数据啊，我整个主流里边主流啊。
09:04
主流呢有ABC，比如说。三张表数据对吧，但是呢，我有两张为表，我们需要我只要AB，假如说数据这样子的好，呃，那现在呢，假如说它是多B型度来看啊。第一个病毒。第二个病毒。有两个冰度。对吧，好，那接下来呢，配置信息跟主流信息对吧，来了来了以后呢，配置信息有两条，那这个配置信息啊。他有没有可能A在这。B在这儿。啊，配置信息A在这儿，B在这儿，诶写到这个状态里边了，但是主流数据来了，主流数据呢，这个A表。这是一张表啊，未来是不是有很多数据啊，它有可能有什么主流数据啊，有A1。
10:00
L。A3A4，比如说四条好按照轮询对吧？啊A1。A2。A3。A4啊，假如呢，还有B1B2B3B4对吧？啊，或者说B1。第二按照逻辑时对吧，B1。B2，诶，他按照文学的规则，它是这样子的，那这里边出现了什么问题，大家想。出现了什么问题？就是按照我们方案对吧，这是第一个并行度，这是第二个变行度，当我们有多个并行度的时候，它会有什么问题？赖续啊。这可不是乱序这么简单呀，刘总啊。你只看到了乱序是吗？数据丢了，这个B有吗？没了。
11:01
这个A2A4有吗？没了，这可不是简单的乱序问题，直接丢了数据，这个B1没了。这个没了，因为你看啊，我A表的数据发送到第二个B1度的时候，这个第二个B度压根就没有关于A表的配置信息，那你是不是这个数据就过滤掉了，你不要了，对吧？同理这边关于B表的数据是不是就过滤掉了？大家想对不对？有没有问你？对吧，他会丢数据吧，啊，他会丢数据可不是乱序这么简单啊，如果乱序那就好了啊，那这个问题就简单了，对吧，他丢数据好，那这种问题我们该如何解决呢。我们怎么解决？
12:05
这个问题我们该怎么解决？怎么现在没有声音了？啊。对了啊，这个时候才到，大家之前猴急的说广播流的一个问题，对吧，那我把配置流做成一个广播流，然后呢，拿着主流跟广播流进行关联，那么既然配置流是一个广播流，那这个数据呢，就在AB都有了这边同理。也有AB了。对吧，因为我是一个广播流，所谓广播上游有的数据，下游每一个病度都有，要不然叫什么广播呀。对吧？啊，那到这一步才能引出来我们的广播流，对吧？啊，他一步一步来的啊，它也有问题，然后去解决这个问题，对吧？那用了广播流以后，是不是咱们配置信息做成广播流，我是不是可以做到将。
13:09
AB。AB2条数据放在所有的并行度里边了。这个问题是不是就得以解决了，对吧，我用一个广播流，诶那这个状态我们刚才说了配置信息呢，写到状态里边，那这个状态就用广播状态。对吧，用的就是广播状态，是不是就搞定了啊，因为咱们是要将配置信息写到所有的病行动里边，哎，用一个广播状态，对吧，这个有没有问题。我们是不是可以用那个广播状态啊。这个应该OK吧，因为老早就有同学在一直提广播流，广播流广播流对吧，好早就有人在提啊，到这一步来说呢，我们用广播流啊。
14:00
呃，那广播流他。未来会不会有问题呢？啊。就是这边再给他扩展一下，呃，我们可以用广播流。啊，这边呢，将我们最终的方案对吧，将配置信息。处理还广播流。啊，那未来呢，我们就可以使用广播状态，但是它这个缺点在于什么？他有缺点哈。广播流缺点在于什么？你没告诉我？对，如果说你数据量太大，那你的状态就非常大，而且你广播你是所有的并行度里边都有一份冗余，对吧？啊，如果配置信息。过大啊，冗余太大，冗余太多对吧，但是对于当前我们这个需求无所谓。
15:06
对于当前咱们这个需求是不是无所谓啊，对吧，因为我们就是配置一个。要几张为表，那不可能太大对吧？好，那假如未来大家也准备用这个广播流，遇到了这个可以声音光大，那我们还有什么办法可以解决这个问题呢？就是假如说这个地方我们真的配置信息特别大啊，不太好用这个广播流，因为你是几个变异度你就乘以几啊。对吧，你是完全备份关系啊，完全一样的有好几份了，对吧，那我们该还有什么办法解决这个问题呢？就是刚才我们所说的，对吧，这边呢，只有A。啊，然后呢，可能来了A1。B对吧，好这边呢，只有B。啊，配置信息只有B这边呢，来了A2B2，我们还有什么办法解决这个丢失数据问题啊。
16:07
想一想。过滤变异度设为一不好不好，这个肯定不好。对了啊，分K啊，你设置为一，这种方案不要提，以后都不要提。OK吧，这种方案就不要提了，生长环境当中绝对不允许的，你像那么大数据量，你设置不度为一，那不疯了吗？对吧，我们自己玩自己测试，为了简单省一点资源，对吧？我们可以设置这个变异度为一，那生产环境当中肯定不会出现这种情况。对吧，所以方总说的没毛病对吧，分K，那我对两个理由呢，进行keep。对吧，我按照表明是不是K呀。对吧，主流按表明可以办，配置流也按表明K办，拿着两个K半以后的。
17:04
流去连接，那我就能保证什么。这边一定不会出现B1对吧，这是L，哎，那这呢是什么B1。B对吧，按照K去划分啊，当然这种方案呢，它也有缺点，有可能会造成什么。这种它也有缺点，它的缺点是什么？啊，有可能会产生数据倾斜，对吧？啊，有可能产生数据倾斜啊，当然它的好处在于数据不会冗余。对吧，它每个病因度呢，都有一部分数据合在一起是一个完整的，对吧，如果你确定没有数据倾斜的情况，是不是它针对于这种配置信息过大的，是不是一个很好的处理方案。
18:03
对吧，啊，你要会这些东西啊，对吧，啊，你不不要只会这个广播流，这个就不太合适了，对吧？所以呢，我们也要知道诶，他可以按照KBY处理，我们无非想要做到什么事啊，想要做到的是将同一张表的数据与它的配置信息放到同一个病因度，如果能做到这个事儿就行了，对吧，两种方案。OK吧，啊，当然我们这选谁呀。当前我们这个需求选谁啊？选第一个还选第二个？选第一个还是选第二个？那很明显吧。对吧，啊，肯定是选第一个了，因为咱们的配置信息呢。并没有多大，很小啊，咱们的配置信息很小对吧，那我们只有46张表，就算你46张表都要，那也就46条数据，对吧，你冗余冗余呗，你搞100个比度又能怎么样呢。
19:06
对吧，数据量很小啊，只有46条，而且呢，你46个是我们全部的表，你就在生产环境当中1000张表，那你为表我打你500张够了吧。啊，你生产环境当中1000张表，我说你为表500张，那你也就是500条数据吧，那这个在我们大数据领域，你500条数据随便随便存对吧，随便存。你太小了，所以呢，对于我们这种配置信息而言，完全就用广播流就够了，你随便冗余对吧，所以数据量小呢，那我们肯定优先选择广播流这种方式，OK吧，好，那到这一步为止，我们将整个的需求就讨论结束了。这个需求还是蛮复杂的哈，对不对，对吧，啊，而且呢，这还是我们只是方案，真正实施起来还有很多困难的点呢。啊，还有很多困难点，好，接下来呢，我们就要开始动手写这个代码啊。

展开

我来说两句

0 条评论

登录后参与评论

作者

腾讯云开发者课程

【合辑】尚硅谷大数据项目之Flink实时数仓3.0

（55/185）

3分48秒

001_实时数仓_课程简介

500

2分38秒

002_数仓概念-数仓简介

420

11分47秒

003_数仓概念-数据分类

430

22分30秒

004_数仓概念-数仓总体介绍

430

4分48秒

005_数仓概念-项目需求分析

400

16分33秒

006_数仓概念-技术选型

390

10分53秒

007_数仓概念-系统数据流程

450

9分59秒

008_数仓概念-框架版本的选择

390

3分18秒

009_数仓概念-具体版本号选择

400

5分35秒

010_数仓概念-服务器选型

310

9分18秒

011_数仓概念-集群规模

430

2分43秒

012_数仓概念-集群资源规划

390

6分22秒

013_同步行为数据模拟-埋点简介

560

17分25秒

014_用户行为数据模拟-用户行为日志内容

520

9分32秒

015_用户行为数据模拟-埋点日志格式

650

15分56秒

016_用户行为数据模拟-克隆三台服务器

390

4分42秒

018_用户行为数据模拟-集群同步脚本

370

7分49秒

019_用户行为数据模拟-免密登录配置

350

8分54秒

020_用户行为数据模拟-安装JDK

400

4分23秒

021_用户行为数据模拟-Linux环境变量说明

420

15分32秒

022_用户行为数据模拟-模拟数据

430

58分32秒

023_用户行为数据采集-hadoop安装

340

20分6秒

024_用户行为数据采集-Hadoop项目经验

390

11分42秒

025_用户行为数据采集-Zookeeper安装

400

14分12秒

026_用户行为数据采集-Kafka安装

370

5分9秒

027_用户行为数据采集-Flume安装

380

35分53秒

028_用户行为数据采集-Flume的KafkaChannel

370

1时11分

029_用户行为数据采集-采集Flume配置

270

10分7秒

030_业务数据采集-电商业务简介

350

38分11秒

031_业务数据采集-电商业务表结构

400

23分27秒

032_业务数据采集-业务数据模拟

430

2分54秒

033_业务数据采集-业务数据通道

370

21分15秒

034_业务数据采集-Maxwell简介

350

33分26秒

035_业务数据采集-Maxwell配置

440

21分19秒

036_业务数据采集-Maxwell使用

400

3分32秒

037_业务数据采集-采集通道maxwell配置

400

2分14秒

038_实时数仓数据同步-实时数仓同步数据

470

16分43秒

039-分层介绍-离线数仓回顾

390

22分47秒

040-分层介绍-实时数仓分层-处理&存储框架概述

440

21分39秒

041-分层介绍-实时数仓分层-DIM层框架选择

440

14分40秒

042-分层介绍-实时数仓分层-DWS&ADS层框架选择

350

11分42秒

043-分层介绍-实时数仓分层-架构说明

320

16分57秒

044-建模理论-范式理论-关系型数据库

420

17分32秒

045-建模理论-维度建模-大数据数仓

420

8分32秒

046-建模理论-维度建模-事实表&维度表&构建数仓流程

400

4分48秒

047-开发环境-集群环境准备

380

9分54秒

048-开发环境-IDEA环境准备

390

4分58秒

049-ODS层-日志数据采集-测试

340

4分30秒

050-ODS层-业务数据采集-测试

370

11分58秒

051-每日回顾

390

8分33秒

052-DIM层-需求分析

410

7分19秒

053-DIM层-问题&解决思路提出

370

5分51秒

054-DIM层-优化1方案讨论

400

13分15秒

055-DIM层-优化2方案讨论

350

20分1秒

056-DIM层-优化2实施讨论

370

14分56秒

057-DIM层-思路整理

330

15分35秒

058-DIM层-代码编写-流程梳理&获取执行环境

400

15分16秒

059-DIM层-代码编写-Kafka消费者工具类封装

380

16分33秒

060-DIM层-代码编写-过滤脏数据

330

31分43秒

061-DIM层-代码编写-配置信息表-字段讨论&说明

380

10分10秒

062-DIM层-代码编写-配置信息表-准备工作

350

7分2秒

063-DIM层-代码编写-使用FlinkCDC读取配置信息表创建流

410

13分44秒

064-DIM层-代码编写-构建配置信息广播流&与主流连接

390

6分3秒

065-DIM层-代码编写-连接流处理逻辑分析

410

37分7秒

066-DIM层-代码编写-处理广播流数据

400

27分26秒

067-DIM层-代码编写-处理主流数据

420

15分58秒

068-DIM层-代码测试

320

21分39秒

069-每日回顾

340

16分22秒

070-DIM层-将数据写出-JdbcSink分析

350

12分27秒

071-DIM层-将数据写出-自定义Sink-创建连接池

350

31分16秒

072-DIM层-将数据写出-自定义Sink-拼接SQL&执行

380

13分37秒

073-DIM层-将数据写出-代码测试

320

24分54秒

074-DWD层-整体介绍&方案说明

390

15分0秒

075-DWD层-流量域-未加工事实表-需求分析

410

19分38秒

076-DWD层-流量域-未加工事实表-思路分析

400

8分54秒

077-DWD层-流量域-未加工事实表-代码编写-时间工具类

330

13分57秒

078-DWD层-流量域-未加工事实表-代码编写-消费&过滤&分组数据

350

16分15秒

079-DWD层-流量域-未加工事实表-代码编写-新老访客标记校验

270

23分3秒

080-DWD层-流量域-未加工事实表-代码编写-分流

390

20分59秒

081-DWD层-流量域-未加工事实表-写出数据&测试

370

10分40秒

082-每日回顾

440

6分59秒

083-DWD层-流量域-未加工事实表-整体测试

350

14分6秒

084-DWD层-流量域-独立访客明细表-需求分析

320

21分5秒

085-DWD层-流量域-独立访客明细表-思路分析

360

6分42秒

086-DWD层-流量域-独立访客明细表-代码编写-获取&过滤&转换数据

380

8分57秒

087-DWD层-流量域-独立访客明细表-代码编写-按照Mid去重&写出到Kafka

260

26分44秒

088-DWD层-流量域-独立访客明细表-代码编写-添加状态TTL

300

8分5秒

089-DWD层-流量域-独立访客明细表-代码测试

360

17分0秒

090-DWD层-流量域-跳出明细表-需求分析&思路一

320

13分56秒

091-DWD层-流量域-跳出明细表-思路二

330

20分21秒

092-DWD层-流量域-跳出明细表-思路三

340

28分0秒

093-DWD层-流量域-跳出明细表-代码编写

360

24分37秒

094-DWD层-流量域-跳出明细表-代码测试

380

10分1秒

095-Flink基础知识扩展-说明

420

12分46秒

096-Flink基础知识扩展-WindowJoin-介绍

350

31分22秒

097-Flink基础知识扩展-IntervalJoin

420

21分51秒

098-Flink基础知识扩展-FlinkSQLJoin-官网说明&InnerJoin编码测试

370

29分42秒

099-Flink基础知识扩展-FlinkSQLJoin-外连接测试

310

18分29秒

100-Flink基础知识扩展-FlinkSQLJoin-LookUpJoin说明&构建维表

420

100

20分46秒

101-FlinkSQLJoin-LookUpJoin编码-构建事实表&关联测试

410

101

11分12秒

102-每日回顾

370

102

7分31秒

103-DWD层-加购事实表-需求分析&思路整理

390

103

24分23秒

104-DWD层-加购事实表-DDL构建topci_db表

450

104

21分24秒

105-DWD层-加购事实表-过滤出加购数据

360

105

28分32秒

106-DWD层-加购事实表-编码完成&测试

380

106

27分23秒

107-DWD层-订单事实预处理表-需求分析&获取原始表和LookUp表

410

107

24分53秒

108-DWD层-订单事实预处理表-过滤出4张表&测试

360

108

29分55秒

109-DWD层-订单事实预处理表-关联5张表&测试

330

109

26分18秒

110-DWD层-订单事实预处理表-将数据写出&测试

300

110

18分36秒

111-每日回顾

300

111

40分2秒

112-DWD层-下单事实表

390

112

22分1秒

113-DWD层-取消订单事实表

370

113

36分56秒

114-DWD层-支付成功需求

400

114

14分34秒

115-DWD层-退单需求

280

115

17分45秒

116-DWD层-退款成功需求

360

116

21分10秒

117-DWD层-优惠券相关需求

430

117

16分56秒

118-DWD层-收藏商品、评价、用户注册需求

390

118

15分30秒

119-DWS层-整体介绍

370

119

33分4秒

120-DWS层-关键词需求-需求分析&工具类封装

260

120

33分14秒

121-DWS层-关键词需求-代码编写2

340

121

20分51秒

122-DWS层-关键词需求-代码编写-开窗聚合&ClickHouse表引擎选择

360

122

25分25秒

123-DWS层-关键词需求-编码完成&测试

340

123

7分21秒

124-每日回顾

430

124

18分4秒

125-DWS层-关键词需求-代码编写-ClickHouse建表&工具类封装-1

370

125

26分10秒

126-DWS层-关键词需求-代码编写-ClickHouse工具类封装-2

460

126

17分39秒

127-DWS层-关键词需求-代码编写-ClickHouse工具类封装-3

400

127

3分13秒

128-DWS层-关键词需求-代码最终测试

410

128

26分53秒

129-DWS层-版本渠道地区访客类别粒度页面浏览需求-需求分析&编码开始

400

129

27分11秒

130-DWS层-版本渠道地区访客类别粒度页面浏览需求-代码编写2

320

130

30分14秒

131-DWS层-版本渠道地区访客类别粒度页面浏览需求-代码测试

360

131

11分12秒

132-每日回顾

360

132

11分10秒

133-DWS层-页面浏览需求-需求分析&思路整理

360

133

8分16秒

134-DWS层-页面浏览需求-消费&转换&过滤数据

290

134

26分42秒

135-DWS层-页面浏览需求-编码完成&测试

350

135

16分44秒

136-DWS层-用户登录需求-需求分析&思路整理

450

136

29分37秒

137-DWS层-用户登录需求-编码&测试

360

137

21分41秒

138-DWS层-用户注册需求

330

138

27分27秒

139-DWS层-加购需求

390

139

6分52秒

140-每日回顾

360

140

24分56秒

141-DWS层-支付成功需求-需求分析

290

141

30分10秒

142-DWS层-支付成功需求-去重思路

290

142

32分0秒

143-DWS层-支付成功需求-思路整理&编码开始

320

143

34分42秒

144-DWS层-支付成功需求-编码完成&测试

360

144

32分7秒

145-DWS层-下单需求-需求分析&代码编写

350

145

25分35秒

146-DWS层-下单需求-编码完成&测试

370

146

13分42秒

147-每日回顾

370

147

10分38秒

148-DWS层-用户SPU粒度下单需求-需求分析-1关联维表

320

148

23分5秒

149-DWS层-用户SPU粒度下单需求-需求分析-2订单ID去重

320

149

21分16秒

150-DWS层-用户SPU粒度下单需求-需求分析-3订单ID去重

440

150

26分44秒

151-DWS层-用户SPU粒度下单需求-思路整理&代码编写

330

151

27分28秒

152-DWS层-用户SPU粒度下单需求-JDBCUtil封装开始

360

152

20分54秒

153-DWS层-用户SPU粒度下单需求-JDBCUtil封装完成&测试

430

153

17分41秒

154-DWS层-用户SPU粒度下单需求-DimUtil封装&测试

430

154

30分48秒

155-DWS层-用户SPU粒度下单需求-关联维表优化1-旁路缓存-说明

380

155

42分20秒

156-DWS层-用户SPU粒度下单需求-关联维表优化1-旁路缓存-编码&测试

340

156

17分0秒

157-每日回顾

420

157

16分20秒

158-DWS层-用户SPU粒度下单需求-优化方案2-异步IO-说明

320

158

13分57秒

159-DWS层-用户SPU粒度下单需求-优化方案2-异步IO-编码介绍

350

159

26分41秒

160-DWS层-用户SPU粒度下单需求-优化方案2-异步IO-异步函数准备工作

370

160

21分37秒

161-DWS层-用户SPU粒度下单需求-优化方案2-异步IO-获取维表信息参数讨论

310

161

17分31秒

162-DWS层-用户SPU粒度下单需求-优化方案2-异步IO-函数完成

380

162

17分50秒

163-DWS层-用户SPU粒度下单需求-优化方案2-异步IO-函数测试

380

163

33分40秒

164-DWS层-用户SPU粒度下单需求-后续&测试

300

164

38分31秒

165-DWS层-省份粒度下单需求

330

165

44分17秒

166-DWS层-品牌品类用户粒度退单需求

370

166

30分55秒

167-ADS&数据可视化层-课程介绍

330

167

31分33秒

168-ADS&数据可视化层-数据接口模块-构建

310

168

21分18秒

169-ADS&数据可视化层-数据接口模块-GMV需求-编码完成）

370

169

17分37秒

170-ADS&数据可视化层-数据接口模块-GMV需求-测试

350

170

11分15秒

171-ADS&数据可视化层-数据接口模块-渠道日活需求-需求分析

440

171

29分35秒

172-ADS&数据可视化层-数据接口模块-渠道日活需求-代码完成

320

172

16分50秒

173-ADS&数据可视化层-数据接口模块-渠道日活需求-测试完成

370

173

25分34秒

174_ADS&数据可视化层（数据接口模块测试已完成&其他需求接口）

310

174

3分5秒

175-Flink优化-课程介绍

370

175

30分37秒

176-Flink优化-资源优化

440

176

23分43秒

177-Flink优化-反压处理

360

177

14分59秒

178-Flink优化-数据倾斜-现象介绍&KeyBy前数据倾斜

520

178

18分17秒

179-Flink优化-数据倾斜-KeyBy后直接聚合

450

179

15分49秒

180-Flink优化-数据倾斜-KeyBy后开窗聚合

550

180

6分36秒

181-Flink优化-KafkaSource

490

181

21分36秒

182-Flink优化-FlinkSQL

360

182

5分2秒

183-实时数仓总结-分层

400

183

10分1秒

184-实时数仓总结-ODS&DWD层

280

184

4分33秒

185-实时数仓总结-DIM层

400

185

16分59秒

186-实时数仓总结-DWS&ADS层

380

056-DIM层-优化2实施讨论

我来说两句

作者

相关推荐

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐