文章/答案/技术大牛

发布

首页视频122-DWS层-关键词需求-代码编写-开窗聚合&ClickHouse表引擎选择

122-DWS层-关键词需求-代码编写-开窗聚合&ClickHouse表引擎选择

2022-12-022022-12-02 16:02:26播放36

点赞0 收藏 0

3.尚硅谷大数据学科--项目实战/尚硅谷大数据项目之Flink实时数仓3.0/视频/122-DWS层-关键词需求-代码编写-开窗聚合&ClickHouse表引擎选择.mp4

原链接：http://www.atguigu.com/

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:00
好，那接下来呢，是分组开窗去和。啊，那如果不开窗做聚合这个东西呢，就比较简单，咱们可以先把这个总体上的逻辑来写一下，对吧？那。先不考虑开窗的问题，对吧，那就是word这个呢是can。心。比如说我叫CT from这张表呢，咱们应该叫table，对吧。加好go back。Word如果不考虑开窗，咱们这个需求是不是就这样子做一个词频统计嘛，对吧，把你切分后的这个单词叫word对吧，把它呢做一个what count，那就是按照它分组求count心就搞定了，对吧？但是呢，我们这个地方不光要分组聚合，还得开窗，那窗口我们得去找一找，这个在S里边咱们应该。
01:02
怎么写？对吧，啊，咱怎么写啊，好，那在我们的circle里边对吧，Queriess啊，这里边就有，诶它有一个window agg。Agggggg对吧，哎，窗口的聚合啊点开。点开好以后呢，那其实它里边呢，有两种不同的写法啊，但是呢，我给大家讲还是讲你们在课堂上学的那种啊，那其实现在呢，他有一套新的新的呢是这样写的。嗯，Select from window table对吧，Go back window start window end，直接这样写就完了，对吧？新的也比较简单，可以看一下这个例子哈。呃，他。啊，在这对吧，在这。Window start window and，这是查窗口的开始时间跟结束时间，对吧？Some，这是。求这个总和啊，就跟我们看德新一样啊，接下来呢，这边。
02:01
From table啊，Table里边呢，这样写的叫to。这很明显是一个。滚动窗口啊，然后go back window start window end，它呢，就是一个窗口里面只有一个值，所以直接人家就上press啊，那咱们呢，如果加word，那多加一个go by word这边呢，多加一个word，然后看到新就好了，对吧，是新的啊，但是呢，大家之前学的不是这种，我们就不聊它了啊，我们往下翻啊，我们往下翻嗯，找到我们所学习的内容啊。呃，这个。啊，大家学的应该是这种对吧，这种写法group window function怎么写呢？这样子的，在这里边呢，在group字段里边，Group by字段里边加一个Java。加一个这个东西，这个是什么呢？To hope session，滚动滑动绘画三种不同窗口对吧，然后呢，这个是时间语义。提取的那个时间字段懂吧，就RT啊，如果说你是处理时间，那就是我们自己给的PT啊好，那interval这是给定窗口大小的。
03:07
啊，那这个滑动牧场窗口大小对吧，这是间隔时间会画成我吧，间隔多少对吧，你比如说你再看下面这个啊，看下例子在这。人家呢，Goodbye，诶user对吧，这是正常的，然后呢，To滚动窗口all the time，这个all time呢，就是这个看见没。Time step看见吧，对吧？啊，这是我们的时间，时间啊，就是那wordmark对吧？好，那我们呢，就把它拿过来改一改对吧？啊，我们十秒窗口，这个注意啊，放到group beds在里边对吧？在这儿加一个逗号，诶放在这，咱们呢不叫all time，咱们叫rt in呢，我们也不开一天的窗口，我们开十秒的窗口，十。Second，对吧？啊十秒啊，这我们窗口，那我们其实也就搞定了啊，那基本上是这样，但是呢，我们之前讨论过一个问题，就是这一次计算完之后，我们关于c house签表我们来讨论。
04:06
我们得。这一步得确定下来，未来往里面放哪些字段。对吧，得放哪些字段好。那接下来呢，我们要讨论可一个签表问题。先呢，我们考虑引擎对吧，我们克里奥里边用什么引擎呢？大家告诉我，你觉得用什么引擎。对吧。在这个地方啊，那未来呢，我们这个抗的心是十秒一个，十秒一个，比如说啊，这边出现了手机。它每十秒里面都可能有一个手机，诶这十秒呢是五次，下十秒呢三次对吧？呃，然后呢八次，然后最终呢，我们要展示展示什么东西呢？手机今天总共被搜索了多少次。对吧，16次。啊，要一个总的值，把这个全部累加起来，这是我们的一个需求的目标，你要搞清楚对吧，就是未来呢，诶，那这是零到十这个数据啊，这是十到20。
05:10
20~30这秒啊，对吧，十秒的窗口嘛，诶他呢，都是这个手机。这个关键词啊，然后最终呢，我们展示到这个可视化页面上面。那。展示一个16啊，基于这个我们把需求给他报出来，对吧，大家想，那在这种情况下，我们应该克林号用什么引擎。可以思考一下。
06:01
啊，大家告诉我。你又不说话，我要抽人了啊。哦。好，我知道。贾总。啊。贾总，你说一下我们你觉得应该用什么引擎这块。就刚才我们所说的业务场景。对吧，最后呢，我要查这个词在今天。被。搜索了多少次展示到页面上面对吧，我们展示搜索最高频次的这种词展示出来。你在直播间吗？你先扣个一啊，看到我敲你名字，你先扣个一好吧。
07:06
这是不在直播间是吗？你你说一下你觉得应该用什么引擎呢。我们现在讨论未来往课里面写我们需要写什么字段，对吧，那第一个呢，那就建表嘛，对吧，建表的话，第一个我们考虑用什么引擎，因为不同引擎呢，可能我们考虑加什么特殊的字段。来做它的一个特殊辅助的一个功能，对吧。啊，用这个丧命motor税，为什么呢？你怎么想的，怎么思考的这个问题？
08:06
啊米motor税怎么想的？嗯。啊，用这个会自动合并。猜猜的啊。猜的。嗯。我来看啊。嗯。凯总，你说一下你在吗？先扣个一。
09:04
啊，你先扣个一。你觉得呢，你觉得应该用什么。你觉得我们应该用什么引擎比较好？就你对于之前click house这几种引擎的一个对比，对吧，它之间那个区别，我们应该用什么引擎比较好，比较好呢？嗯，用replacing motor感觉需要去重，嗯，你感觉哪块需要去重，为什么它需要去虫呢？
10:03
就是你感觉需要驱虫，那你能不能告诉我哪一块需要驱虫呢？嗯，哪一块需要去肿啊。
11:04
就是你感觉需要驱虫哪块嘛，你感觉哪块需要驱虫啊。啊又不错，其他同学呢，怎么认为的，这块我们用什么引擎啊。我们应该用什么引擎啊？啊，不太确定。其他同学呢？有没有同学有有有想法可以说一说？啊，方总说用some模税，因为有预聚合。理由合适吧，对吧，因为。我们最后呢，肯定要做这个聚合，肯定要做这个聚合，对吧，因为我们说了按天聚合，你现在呢，是十秒一个窗口，十秒一个窗口，那未来呢，很明显我们要按天聚合吧。
12:02
对吧，啊，就从今天凌晨截止到现在。我把现有的数据聚合起来。啊，把现有的数据聚合起来对吧，那这样的话，我用商米模税，它隔一段时间会做合并，那未来呢，我在这个house里边，里边存的数据是不是就会少很多啊。数据量就会减少吧。对吧，而是理由啊，理由在这儿啊，对吧，你用三税肯定就一聚合嘛，有一聚合减少我们未来存储的数据量，那未来呢，我查的时候效率是不是更高，因为我可以要聚合的数据就会很少了。没毛病吧？好，那有没有其他不同答案？啊，方总说了，用some motor税，理由是有预聚盒，按照我们的要求，好像有预聚盒会更好一点，第一，存储的数据量少，第二。查询的效率高，你数据量少，查询的时候数据量这个效率不就高嘛，对吧。
13:04
有没有同学有其他的想法？或者说商民税有没有什么缺点？对吧，我们不能光考虑它优点，那想一想它有什么缺点呢？他像这种直接就给我们聚合了，他有没有什么缺点呢。好，那隔一段时间对吧，它就自动做聚合，它有没有缺点呢。开销比较大，开销开销比较大，你指的是隔一段时间聚合一次，开销比较大是吗？这个开销还好吧，你隔一段时间聚合一次，那你要是不聚合不用。你每一次查，你每隔十秒查一次的时候，你都要去喝1C。
14:02
你都要写这个聚合ec。不在一个分区不会去和，那我把按天分区不就好了吗。对吧，那我按天分去不就得了呗。这个还好吧，你正常的，你也要做分区表，你不也得一天一个分区吗。对吧。啊，还有呢啊，但是很好啊，大家都在开动脑筋在想，对吧？啊但是呢，嗯，可能方向不太对，但是这个没关系，只要你肯想就行了。还有没有？方总，你自己觉得呢，就是这个some motor tree，它有没有什么缺点呢？他有没有缺点？不能求。平均值。哎，可以算一个。对吧，但实际上这个平均值也没什么意义了，为什么？因为因为你这个是十秒一聚合，它其实本身你只要开窗了，其实就不能求平均值了。
15:07
我本来就是十秒一聚合的，对吧？啊，当然如果你说你不不开窗。对比那确实算一个缺点，对吧，啊很好啊。如果不开窗。我本身就不开窗。对吧，我直接把这个结果word word1word1写出去，对吧，那。确实可以算一个什么。缺点对吧，但是你已经开窗了，你就不能求平均值了，你那已经开窗了，你都已经做了一次聚合了，你就没办法求平均值了，对吧。看见没有？好，那我们想每隔一段时间呢，它就自动聚合，它就没有保留我们之前十秒十秒的那种数据，对吧？啊，那假如说我有一个业务呢，我要求这个分时。
16:04
我要做一个什么分时统计。能懂吗？我要做这个分时统计，就是说我要求每个小时。我假如说需求变了，对吧，你那正常的求。今天。那。我能不能求分时呢？如果说你用扫米你就没办法做到了，因为他把数据聚合这一块，对吧，你就没办法拆分出来这个分时了，好这是一个点嘛，就是他的需求呢。如果你用了sum米，你的需求呢？未来这个表做的需求就比较单一了，你只能求这个，因为它会自动帮你聚合，这是一个缺点，能明白吗？这个点能不能明白？能明白给我扣一好吧，这是我们说的对吧，你不能求更细力度的，假如说你是按天分区的，他会把一天的数据隔一段时间做一个聚合，那你呢，时间这个力度就不能比天小了，但明明我们开窗按十秒开的窗口。
17:02
对吧，最后求的需求只能按天求。不好。对吧，这个是一个点，还有一个你想啊。这是从需求角度来考虑的，还有一个是什么东西呢？在于如果你任务挂掉，你这个窗口呢。又读了一次。啊，这个DWS呢，挂掉了对吧，我任务挂掉了，我又重新读了一次，我重新读了一次之后，他是不是又写了，把这个窗口又写了一遍了。就数据没办法保证一致性了，大家能明白吗？对吧。就是你数据呢会多。啊，那你如果挂掉了，你把这个窗口重新消费一份，那你就数据完全重复了。而且你还干不掉，因为前面数据可能已经被聚合进去了。对吧，已经都聚合进去了，你再写过来，他也没办法区分有没有写了完了。
18:00
数据多了出错了，一致性丢失了，对吧，所以我们呢，Flink如果写出数据的时候考虑一致性有两个吧，第一。下游如果有事物，我用两阶段提交。对吧，如果下游没有事物，那看有没有密等性。对吧，如果有幂等性，那我幂等写出，哎，到下游自动做驱虫是不是也可以呀。对吧，我到下游自动的做这个去虫。那是不是也可以啊，能明白吗？对吧，是这样的老师。啊，是这个意思对吧，所以呢，我们其实归根结底呢，两个缺点还得用这个replaceable tree对吧，第一。它呢具有这个去重功能，就刚才那个凯总所提到的对吧，诶可能觉得数据要去重，我问他在哪去重，他可能他不太清楚对吧，其实就什么时候呢，当我们任务挂掉了，我们重新消费，我要做驱虫。我要保证最终数据的一致性，对吧，用replace，因为它具有密性。
19:03
好好，第二个placing呢，它并不会把数据直接聚合起来。那么我们可以做这种分时指标。啊，可以求这种分时指标对吧，但是它的缺点在于什么呢？跟三位模税相比，它的数据量会大。比商米motor税未来这个表里的存的数据量要大很多，对吧，因为它不会做聚合啊，不会做聚合，好，那我们敲定了用replacing motor，好吧，那接下来我们想一想啊。我们那。三个字段。啊，但是最后一个那个。逐渐了，就是我们的。所以可以先不考虑对吧，好，那我们先考虑这个分区以及autob，就是你按什么东西进行去重。来想一想，现在呢？我们决定用replacing摸着睡了。
20:02
对吧，那么咱们。分区按什么分区呢？接表的时候按什么分区呢，以及我们。去虫outb字段按谁进行去重呢？大家觉得你觉得应该怎么做？啊，就是我们已经确定了，用replace综合来看它要更好一点，对吧？啊，那我们按什么分区。按什么order by，也就是说按什么去虫对吧。想一想啊，动脑子想一想。

展开

我来说两句

0 条评论

登录后参与评论

作者

腾讯云开发者课程

【合辑】尚硅谷大数据项目之Flink实时数仓3.0

（121/185）

3分48秒

001_实时数仓_课程简介

500

2分38秒

002_数仓概念-数仓简介

420

11分47秒

003_数仓概念-数据分类

430

22分30秒

004_数仓概念-数仓总体介绍

430

4分48秒

005_数仓概念-项目需求分析

400

16分33秒

006_数仓概念-技术选型

390

10分53秒

007_数仓概念-系统数据流程

450

9分59秒

008_数仓概念-框架版本的选择

390

3分18秒

009_数仓概念-具体版本号选择

400

5分35秒

010_数仓概念-服务器选型

310

9分18秒

011_数仓概念-集群规模

430

2分43秒

012_数仓概念-集群资源规划

390

6分22秒

013_同步行为数据模拟-埋点简介

560

17分25秒

014_用户行为数据模拟-用户行为日志内容

520

9分32秒

015_用户行为数据模拟-埋点日志格式

650

15分56秒

016_用户行为数据模拟-克隆三台服务器

390

4分42秒

018_用户行为数据模拟-集群同步脚本

370

7分49秒

019_用户行为数据模拟-免密登录配置

350

8分54秒

020_用户行为数据模拟-安装JDK

400

4分23秒

021_用户行为数据模拟-Linux环境变量说明

420

15分32秒

022_用户行为数据模拟-模拟数据

430

58分32秒

023_用户行为数据采集-hadoop安装

340

20分6秒

024_用户行为数据采集-Hadoop项目经验

390

11分42秒

025_用户行为数据采集-Zookeeper安装

400

14分12秒

026_用户行为数据采集-Kafka安装

370

5分9秒

027_用户行为数据采集-Flume安装

380

35分53秒

028_用户行为数据采集-Flume的KafkaChannel

370

1时11分

029_用户行为数据采集-采集Flume配置

270

10分7秒

030_业务数据采集-电商业务简介

350

38分11秒

031_业务数据采集-电商业务表结构

400

23分27秒

032_业务数据采集-业务数据模拟

430

2分54秒

033_业务数据采集-业务数据通道

370

21分15秒

034_业务数据采集-Maxwell简介

350

33分26秒

035_业务数据采集-Maxwell配置

440

21分19秒

036_业务数据采集-Maxwell使用

400

3分32秒

037_业务数据采集-采集通道maxwell配置

400

2分14秒

038_实时数仓数据同步-实时数仓同步数据

470

16分43秒

039-分层介绍-离线数仓回顾

390

22分47秒

040-分层介绍-实时数仓分层-处理&存储框架概述

440

21分39秒

041-分层介绍-实时数仓分层-DIM层框架选择

440

14分40秒

042-分层介绍-实时数仓分层-DWS&ADS层框架选择

350

11分42秒

043-分层介绍-实时数仓分层-架构说明

320

16分57秒

044-建模理论-范式理论-关系型数据库

420

17分32秒

045-建模理论-维度建模-大数据数仓

420

8分32秒

046-建模理论-维度建模-事实表&维度表&构建数仓流程

400

4分48秒

047-开发环境-集群环境准备

380

9分54秒

048-开发环境-IDEA环境准备

390

4分58秒

049-ODS层-日志数据采集-测试

340

4分30秒

050-ODS层-业务数据采集-测试

370

11分58秒

051-每日回顾

390

8分33秒

052-DIM层-需求分析

410

7分19秒

053-DIM层-问题&解决思路提出

370

5分51秒

054-DIM层-优化1方案讨论

400

13分15秒

055-DIM层-优化2方案讨论

350

20分1秒

056-DIM层-优化2实施讨论

370

14分56秒

057-DIM层-思路整理

330

15分35秒

058-DIM层-代码编写-流程梳理&获取执行环境

400

15分16秒

059-DIM层-代码编写-Kafka消费者工具类封装

380

16分33秒

060-DIM层-代码编写-过滤脏数据

330

31分43秒

061-DIM层-代码编写-配置信息表-字段讨论&说明

380

10分10秒

062-DIM层-代码编写-配置信息表-准备工作

350

7分2秒

063-DIM层-代码编写-使用FlinkCDC读取配置信息表创建流

410

13分44秒

064-DIM层-代码编写-构建配置信息广播流&与主流连接

390

6分3秒

065-DIM层-代码编写-连接流处理逻辑分析

410

37分7秒

066-DIM层-代码编写-处理广播流数据

400

27分26秒

067-DIM层-代码编写-处理主流数据

420

15分58秒

068-DIM层-代码测试

320

21分39秒

069-每日回顾

340

16分22秒

070-DIM层-将数据写出-JdbcSink分析

350

12分27秒

071-DIM层-将数据写出-自定义Sink-创建连接池

350

31分16秒

072-DIM层-将数据写出-自定义Sink-拼接SQL&执行

380

13分37秒

073-DIM层-将数据写出-代码测试

320

24分54秒

074-DWD层-整体介绍&方案说明

390

15分0秒

075-DWD层-流量域-未加工事实表-需求分析

410

19分38秒

076-DWD层-流量域-未加工事实表-思路分析

400

8分54秒

077-DWD层-流量域-未加工事实表-代码编写-时间工具类

330

13分57秒

078-DWD层-流量域-未加工事实表-代码编写-消费&过滤&分组数据

350

16分15秒

079-DWD层-流量域-未加工事实表-代码编写-新老访客标记校验

270

23分3秒

080-DWD层-流量域-未加工事实表-代码编写-分流

390

20分59秒

081-DWD层-流量域-未加工事实表-写出数据&测试

370

10分40秒

082-每日回顾

440

6分59秒

083-DWD层-流量域-未加工事实表-整体测试

350

14分6秒

084-DWD层-流量域-独立访客明细表-需求分析

320

21分5秒

085-DWD层-流量域-独立访客明细表-思路分析

360

6分42秒

086-DWD层-流量域-独立访客明细表-代码编写-获取&过滤&转换数据

380

8分57秒

087-DWD层-流量域-独立访客明细表-代码编写-按照Mid去重&写出到Kafka

260

26分44秒

088-DWD层-流量域-独立访客明细表-代码编写-添加状态TTL

300

8分5秒

089-DWD层-流量域-独立访客明细表-代码测试

360

17分0秒

090-DWD层-流量域-跳出明细表-需求分析&思路一

320

13分56秒

091-DWD层-流量域-跳出明细表-思路二

330

20分21秒

092-DWD层-流量域-跳出明细表-思路三

340

28分0秒

093-DWD层-流量域-跳出明细表-代码编写

360

24分37秒

094-DWD层-流量域-跳出明细表-代码测试

380

10分1秒

095-Flink基础知识扩展-说明

420

12分46秒

096-Flink基础知识扩展-WindowJoin-介绍

350

31分22秒

097-Flink基础知识扩展-IntervalJoin

420

21分51秒

098-Flink基础知识扩展-FlinkSQLJoin-官网说明&InnerJoin编码测试

370

29分42秒

099-Flink基础知识扩展-FlinkSQLJoin-外连接测试

310

18分29秒

100-Flink基础知识扩展-FlinkSQLJoin-LookUpJoin说明&构建维表

420

100

20分46秒

101-FlinkSQLJoin-LookUpJoin编码-构建事实表&关联测试

410

101

11分12秒

102-每日回顾

370

102

7分31秒

103-DWD层-加购事实表-需求分析&思路整理

390

103

24分23秒

104-DWD层-加购事实表-DDL构建topci_db表

450

104

21分24秒

105-DWD层-加购事实表-过滤出加购数据

360

105

28分32秒

106-DWD层-加购事实表-编码完成&测试

380

106

27分23秒

107-DWD层-订单事实预处理表-需求分析&获取原始表和LookUp表

410

107

24分53秒

108-DWD层-订单事实预处理表-过滤出4张表&测试

360

108

29分55秒

109-DWD层-订单事实预处理表-关联5张表&测试

330

109

26分18秒

110-DWD层-订单事实预处理表-将数据写出&测试

300

110

18分36秒

111-每日回顾

300

111

40分2秒

112-DWD层-下单事实表

390

112

22分1秒

113-DWD层-取消订单事实表

370

113

36分56秒

114-DWD层-支付成功需求

400

114

14分34秒

115-DWD层-退单需求

280

115

17分45秒

116-DWD层-退款成功需求

360

116

21分10秒

117-DWD层-优惠券相关需求

430

117

16分56秒

118-DWD层-收藏商品、评价、用户注册需求

390

118

15分30秒

119-DWS层-整体介绍

370

119

33分4秒

120-DWS层-关键词需求-需求分析&工具类封装

260

120

33分14秒

121-DWS层-关键词需求-代码编写2

340

121

20分51秒

122-DWS层-关键词需求-代码编写-开窗聚合&ClickHouse表引擎选择

360

122

25分25秒

123-DWS层-关键词需求-编码完成&测试

340

123

7分21秒

124-每日回顾

430

124

18分4秒

125-DWS层-关键词需求-代码编写-ClickHouse建表&工具类封装-1

370

125

26分10秒

126-DWS层-关键词需求-代码编写-ClickHouse工具类封装-2

460

126

17分39秒

127-DWS层-关键词需求-代码编写-ClickHouse工具类封装-3

400

127

3分13秒

128-DWS层-关键词需求-代码最终测试

410

128

26分53秒

129-DWS层-版本渠道地区访客类别粒度页面浏览需求-需求分析&编码开始

400

129

27分11秒

130-DWS层-版本渠道地区访客类别粒度页面浏览需求-代码编写2

320

130

30分14秒

131-DWS层-版本渠道地区访客类别粒度页面浏览需求-代码测试

360

131

11分12秒

132-每日回顾

360

132

11分10秒

133-DWS层-页面浏览需求-需求分析&思路整理

360

133

8分16秒

134-DWS层-页面浏览需求-消费&转换&过滤数据

290

134

26分42秒

135-DWS层-页面浏览需求-编码完成&测试

350

135

16分44秒

136-DWS层-用户登录需求-需求分析&思路整理

450

136

29分37秒

137-DWS层-用户登录需求-编码&测试

360

137

21分41秒

138-DWS层-用户注册需求

330

138

27分27秒

139-DWS层-加购需求

390

139

6分52秒

140-每日回顾

360

140

24分56秒

141-DWS层-支付成功需求-需求分析

290

141

30分10秒

142-DWS层-支付成功需求-去重思路

290

142

32分0秒

143-DWS层-支付成功需求-思路整理&编码开始

320

143

34分42秒

144-DWS层-支付成功需求-编码完成&测试

360

144

32分7秒

145-DWS层-下单需求-需求分析&代码编写

350

145

25分35秒

146-DWS层-下单需求-编码完成&测试

370

146

13分42秒

147-每日回顾

370

147

10分38秒

148-DWS层-用户SPU粒度下单需求-需求分析-1关联维表

320

148

23分5秒

149-DWS层-用户SPU粒度下单需求-需求分析-2订单ID去重

320

149

21分16秒

150-DWS层-用户SPU粒度下单需求-需求分析-3订单ID去重

440

150

26分44秒

151-DWS层-用户SPU粒度下单需求-思路整理&代码编写

330

151

27分28秒

152-DWS层-用户SPU粒度下单需求-JDBCUtil封装开始

360

152

20分54秒

153-DWS层-用户SPU粒度下单需求-JDBCUtil封装完成&测试

430

153

17分41秒

154-DWS层-用户SPU粒度下单需求-DimUtil封装&测试

430

154

30分48秒

155-DWS层-用户SPU粒度下单需求-关联维表优化1-旁路缓存-说明

380

155

42分20秒

156-DWS层-用户SPU粒度下单需求-关联维表优化1-旁路缓存-编码&测试

340

156

17分0秒

157-每日回顾

420

157

16分20秒

158-DWS层-用户SPU粒度下单需求-优化方案2-异步IO-说明

320

158

13分57秒

159-DWS层-用户SPU粒度下单需求-优化方案2-异步IO-编码介绍

350

159

26分41秒

160-DWS层-用户SPU粒度下单需求-优化方案2-异步IO-异步函数准备工作

370

160

21分37秒

161-DWS层-用户SPU粒度下单需求-优化方案2-异步IO-获取维表信息参数讨论

310

161

17分31秒

162-DWS层-用户SPU粒度下单需求-优化方案2-异步IO-函数完成

380

162

17分50秒

163-DWS层-用户SPU粒度下单需求-优化方案2-异步IO-函数测试

380

163

33分40秒

164-DWS层-用户SPU粒度下单需求-后续&测试

300

164

38分31秒

165-DWS层-省份粒度下单需求

330

165

44分17秒

166-DWS层-品牌品类用户粒度退单需求

370

166

30分55秒

167-ADS&数据可视化层-课程介绍

330

167

31分33秒

168-ADS&数据可视化层-数据接口模块-构建

310

168

21分18秒

169-ADS&数据可视化层-数据接口模块-GMV需求-编码完成）

370

169

17分37秒

170-ADS&数据可视化层-数据接口模块-GMV需求-测试

350

170

11分15秒

171-ADS&数据可视化层-数据接口模块-渠道日活需求-需求分析

440

171

29分35秒

172-ADS&数据可视化层-数据接口模块-渠道日活需求-代码完成

320

172

16分50秒

173-ADS&数据可视化层-数据接口模块-渠道日活需求-测试完成

370

173

25分34秒

174_ADS&数据可视化层（数据接口模块测试已完成&其他需求接口）

310

174

3分5秒

175-Flink优化-课程介绍

370

175

30分37秒

176-Flink优化-资源优化

440

176

23分43秒

177-Flink优化-反压处理

360

177

14分59秒

178-Flink优化-数据倾斜-现象介绍&KeyBy前数据倾斜

520

178

18分17秒

179-Flink优化-数据倾斜-KeyBy后直接聚合

450

179

15分49秒

180-Flink优化-数据倾斜-KeyBy后开窗聚合

550

180

6分36秒

181-Flink优化-KafkaSource

490

181

21分36秒

182-Flink优化-FlinkSQL

360

182

5分2秒

183-实时数仓总结-分层

400

183

10分1秒

184-实时数仓总结-ODS&DWD层

280

184

4分33秒

185-实时数仓总结-DIM层

400

185

16分59秒

186-实时数仓总结-DWS&ADS层

380

122-DWS层-关键词需求-代码编写-开窗聚合&ClickHouse表引擎选择

我来说两句

作者

相关推荐

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐