文章/答案/技术大牛

发布

首页视频015.尚硅谷_Flink-运行时架构_任务调度原理（一）_并行度和slot

015.尚硅谷_Flink-运行时架构_任务调度原理（一）_并行度和slot

2022-12-022022-12-02 16:02:28播放35

点赞0 收藏 0

尚硅谷大数学科--选学技术丰富/尚硅谷Flink从入门到实战（scala版）/视频/015.尚硅谷_Flink-运行时架构_任务调度原理（一）_并行度和slot.mp4

原链接：http://www.atguigu.com/

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:00
我们接下来再来给大家介绍一下flink里边任务调度的一个原理啊，那前面其实我们都已经知道了，在处理这个flink程序的时候，提交的时候呢，我们主要是先由这个dispat啊，或者说有这个资源管理平台啊，把这个集成起来，呃，那提交的时候主要是要把它给到job manager，那在这个过程当中，Job manager拿到的东西到底是什么，然后他又要做什么样的调整转换，然后把它，呃，就是申请到资源之后，把它交给他manager去执行呢？呃，这里边就涉及到了一个任务调度的过程。大家看一下这幅图，这幅图呢就详细的给我们说明了，从一开始我们写出来的这个源码，Flink的这个程序的code，到最后我们真正转换的可可执行的每一个task这样的一个过程。简单来讲的话，那就是一开始我们先写出这个code的啊，大家知道，呃，首先你是要做这个编译打包对吧？啊，那那其实这个编译打包的时候会生成一个什么东西呢？它会按照我们它代码里边定义的那个处理流程，大家发现我们在代码里边其实就是一步一步，呃，那那其实就是每一步操作都跟在后边对吧？啊，就是SC里边的这种，呃，链式调用的这种方式啊，一步一步往后面做转换，那其实我们已经定义好了一个数据处理的流程啊，那么根据这个原始的代码，直接就可以生成一个叫做逻辑上的数据流图，就是一个data gra。
01:40
啊，这这就这就跟我们整个数据处理的那个流程是一模一样的啊，就是大家能想到啊，我们处理的那个DG嘛，然后接下来呢，呃，就是我们首先是要有一个客户端把这个东西发送出来，这个客户端当然有可能是我们的命令行对吧？呃，也有可能是这个web UI，反正是有这样一个接口，我们要把它做一个发送，那在这个发送的过程当中呢，本身客户端这里就首先会对当前的这个流流程啊，就是我们的这个数据流图data flow graph做一个简单的调整，把有一些可以合并的操作就合在一起。
02:20
所以大家后来发现我们提交那个job之后，你运行的时候呢，会发现它有一些任务是合在一起的，对吧？这步操作在一开始就做完了，然后接下来呢，就把当前已经合并好的啊，大家注意啊，当前这个呃数据流图做合并之后，就得到了一个新的数据流图，对吧？这个数据流图一般情况我们把它叫做一个job graph，然后这个图以及我们这里边要执行的那个抓包啊，所有的这些文件就提交给了job manager。然后job manager这里呢，接下来就会分析我们当前的这个数据流图啊，他就要判断你当前并行度到底是几呢，对吧？然后每一个任务它有几个并行的子任务呢？我要把它拆开，拆开之后大家就想到是不是就可以知道我当前到底有多少个任务，然后它这里面有调度器对吧？然后就可以，呃，可以去判断我到底需要多少个slot，然后怎么样去分配啊，到底怎么样去执行这样的一个任务了啊，那所以接下来我们知道它的流程就是我去申请资源对吧？Resource manager那边去申请资源，申请到了之后，大家看这边我们有两个task manager给它提供资源，对吧？然后这里边的每个task manager里边，注意本身是有三个slot，这是它的一个静态的能力，也就是说我最多可以提供三个slot来执行并行的程序，执行并行的任务，但是我现在这个当前的这个任务啊。
03:52
那这个job是不是要把他的这个静态的能力全用起来呢？诶，可以不用，这就是我们说的，你有多大本事，你可以不用出来呀，对吧，你可以收着嘛，可以这个收，收着力去去做这个事儿，对吧，不不尽全力，所以这里边大家看我们本来有三个slot，但是这里边呢，利用起来的只有两个，只需要占用两个，因为这跟我们当时的那个并行度有关，对吧，你到底需要怎么样去并行，你把那个拆分出来之后，发现我当前需要四个lo去执行，那大家看到job manager呢，就做了一个调度，把它分配给了两个worker上的，每个worker上的两个slot分别分配了一个任务。
04:37
一个task，然后接下来大家看到这个job manager和task manager之间，他们做的这个数据传输呢，哎，那那主要就是job manager这边给task manager，它主要做调度，做分配这个，呃，做做这个任务的调度和管理嘛，所以主要给这边传的，就是比方说。这个deploy一个部署一个任务，对吧，或者说我要去停一个任务，或者说cancel取消一个任务，这些信息是由job manager发出指令发给他manager，另外还有就是我们说他会去管理我们的那个checkpoint的机制，对吧，做存盘的那个机制，那个信息也是照manager这边发出的。
05:15
而task manager这边给他传什么呢？那就是我们当前，哎，就是有一些比方说统计信息，心跳信息，对吧，所有的这些信息要实时的传，传递给这个job manager，他们之间是保持着这个连接的状态，这就是整个。在任务运行执行的过程当中，所谓的这个调度的一个原理啊，整体上来讲就是这样的一个过程。那大家可能就会有有这个具体的问题了，对吧，你这个其实讲解的还是比较泛泛而谈的一个概念吧，那具体来说的话，诶，我们就会想到，到底这里边的这个task跟slot的关系是什么样的呢？哎，我们之前又说过这个并行度，那并行度在这里边的体现又是什么样的呢？
06:04
啊，所以大家如果要是有这样的疑问的话，大家可以先看一下啊，我们这里总结出来这样的三个问题，大家可以先思考一下，就是首先我们要思考一下，在flink里边到底怎么样去实现并行计算呢？这个问题比较简单，我们在代码里面体现的非常明显，就是每一个每一步计算操作啊，就相当于我们在代码里边实现的每一步，每一个那个算子调用啊，每一个运算的那个算子，它都可以在后边去给它设置一个啊parallelism对吧，一个并行度，所以说只要设置了并行度之后，那是不是相当于当前的这个操作啊，这个算子就可以并行执行了，对吧？就是当前数据来了之后，我就可以分配到，呃，不同的啊，同时不同的数据都可以分配到这个，呃，同时比方说我们这个map任务有三个并行度，那那我们来了数据之后呢，你就可以同时分配到这并行的三个map任务里边，同时做操作，这不就并行呢。
07:04
计算了吗？啊，所以这个其实是非常简单的一个实现啊，这个问题我们就解决了，那接下来还会有问题，就是说我们当前并行的这这个任务到底需要占用多少slot呢？这个大家其实也比较好理解，就是那你既然是并行的任务嘛，像我们前面给大家说的，假如说啊，现在这个map任务它并行的有三个，它的并行度设了三，那我们知道当前这个map不就有三个并行的子任务吗？对吧，我们把它叫做这个sub task啊，这个并行的子任务，那如果说我们想要让它并行起来的话，那是不是这三个并行的任务就必须以每一个任务占用一个单独的slot呀，大家想想是不是这样？呃，因为我们说这个slot是独享的一组这个资源单位嘛，所以你想要让这个当前的任务并行，那就必须给他分配单独的资源，你假如他们混起来的话，那那这个就没法没法去并行了，对吧，他们已经混为一谈了嘛，呃，特别是就是假如说我们还是呃，CPU资源你还要共享的话，那到最后你相当于还是做完一个做一个嘛，根本就没有并行。
08:16
所以我们现在想要实现并行，那肯定当前任务它的并行子任务都应该分配到不同的lo上啊，那有同学可能就想了，那这个就很简单了，对吧？啊，那我们结合最后一个问题来看一个流处理程序里面到底包含多少个任务呢？啊，那我们就想了，那这不就是叠加起来吗？比方说这个map，这里边有这个三个子任务对吧，并行的子任务，然后比方说前面我有一部这个filter。哎，那那假如说这个filter我的并行度设置的是二，那我就是三加二嘛，这不就是五个任务吗？对吧，最后执行那每一个任务都要占一个slot，那就占用五个slot嘛，不就这么简单吗。但是其实我们在做这个测试，在部署提交的时候，大家发现具体提交上去之后，你看到生成的那个执行计划图，它里边的任务数量不是这样的。
09:11
首先我们发现有一些任务可以合并对吧？然后另外你会发现他最后占占用的slot数量好像也不是按照这个来来定的，那为什么最后的行为这么奇怪呢？弗link到底底层对这个任务调度有什么优化，有什么默认的规则会导致出现这样的行为呢？啊，大家还记得我们当时如果说一开始并行度是二的话，大家还记得我们的那个word count程序是有六个任务对吧？分配出来相当于总共所有的任务算起来啊，算上这个并行的任务一共有六个啊，那那最后你跑不起来，这个我们认为是很正常的，对吧？资源不够嘛，一开始这个集群根本不够，呃，然后如果说你要是把并行都改成一的话，大家看到有两个任务，但是我们只有一个slot，其实也跑起来了。
10:01
那你说这到底为什么呢？为什么说两个任务可以在一个lo里边执行呢？啊，接下来我们就怀揣着这些问题给大家来讲一讲，啊，剩下的一些具体的概念给大家来再做一个扩展说明。首先这里边要给大家说的是这个关于并行度的概念，我们把这个概念再给大家详细的做一个讲解啊，那首先这里边就是我们说flink程序里边，它的执行是有这个并行的特点，那么这个并行怎么实现的呢？分布式嘛，啊对吧，这个分布式，而且我们每一个task manager上边还划分了不同的slot，诶这个就是涉及到这个并行跟slot的一个关系了，所以说在这种场景下，我们把不同的并行子任务分配到不同的slo上去执行，然后就实现了一个并行的处理，并行的计算，那我们在代码里边可以直接指定每一个算子，就是我们的那个操作，对吧，直接每一步操作，Map filter sum，每一步操作。
11:09
直直接可以指定它的并行子任务的个数，那指定的这个并行子任务的个数就叫做当前算子的并行度对吧？啊，这就是我们所谓的这个parallelism它的一个概念，那大家看到前面我们定义的这样的一个呃，几步操作啊，当然这几步操作里边涉及到一些比较复杂的，我们现在还没有接触，比方说像这个window开窗对吧，做这个窗口计算，呃，大家简单来看的话就是sources，先读数据源，然后呢，Map做一个转换，然后是做开窗处理，最后在think是做一个输出啊类似于这样的几步操作对吧？啊，那对应的这个并行度设设多少呢？比方说前面几步操作我都设了并行度是二，那大家就知道你拆开的话，每一个是不是都应该有两个并行的子任务啊啊，所以这就是当前它这个算子的并行度，然后think，假如并行度我们设了一啊，那大家看它的并行子任务就只有一个，这就是他的并行度。
12:08
那我们想有时候我们也会说整个这个，呃，流处理啊，就是当前整个流，我们说它有一个总的并行度，这个总的并行度又是什么呢。啊，有同学可能说，哎，那就是之前我们在代码里边那个env，直接在环境里边默认设的那个并行度嘛，全局设的那个并行度嘛，啊这里边我们说流处理程序的并行度跟那个概念还不一样，那个相当于是一个每个算子的默认并行度，对吧？当前环境里边的默认并行度跟我们在外部去提交任务的时候给的那个杠P参数是类似的，只不过是写在代码里边了，那那这里边如果说我们说当前的这个流处理程序它有一个总并行度的话，一般指的是。指的是当前所有算子里边最大的那个并行度，就指的是当前这个流的并行度。
13:02
啊，大家先先知道有这样的一个概念对吧？有这样的一个定义，那为什么有这样的一个定义呢？啊，我们马上就会知道，它其实就是跟我们所占据的slot数量有关啊，所以后边我们就要给大家说到，就是到底什么是slot对吧？Task manager跟slot的一个关系，其实前面我们也已经说了啊，所谓的这个slot其实是什么呢？它其实就是当前我们在做这个flink集群里边资源分配管理的一个就是固定大小的资源，资源的子集，对吧？这样的固定大小的一组资源啊，那在具体来讲呢，Slot它主要是按照什么划分，主要是按照独立的内存做划分的，因为我们想你在做这个执行任务的时候，主要需要的资源，那就是内存和CPU嘛，我们现在这个弗link集群架构里边，它对CPU的资源没有直接做隔离，没有做划分，因为大家知道CPU本身你是可以做。
14:03
即使是一个CPU也可以划分这个并行任务，对吧，你可以有多线程吧，那那就是做这个时间片轮转了啊啊，尽管看起来好像并不是真正意义上的并行，但其实可以实现这个效果的，所以在flink里边，它的slo的资源对CPU没有隔离，只是对内存有一块独享的内存资源啊，做了一个隔离，那所以说，呃，比方说现在我们这个task manager有三个slot的话，那就相当于是什么呢？就是把当前这个manager啊，我们自己管理的那个内存，内存资源直接就是manager的那个memory啊，直接把它划分成了三等份，然后分配到了每个独立的lo上面去。然后我们在执行的时候啊，在在执行这个任务的时候，这就有点相当于是什么呢？啊，这就是相当于每一个slot上就可以单独的执行一个独立的任务，然后在这个上面去去跑去运行就完事了，那对应我们的这个宏观的概念，大家可以认为每一个task manager呢，可以认为是一个GVM进程，然后里边执行的每一个任务可以认为是一个独立的线程，对吧？那这相当于是一个thad，那每一个线程大家想你在去执行的时候，是不是要有自己的独立的这个内存资源这一份，为了保证它这个呃，线程之间不互相影响对吧，不互相干扰，我们要给他一份独立的内存空间，那这个就叫做slot对吧，他所占据的占据的这份资源，线程所占据的这份资源就叫做slot。
15:36
啊，那所以这里面其实就是说，呃，大家就会看到啊，就是所谓的这个slot数量，它其实是task manager啊，就相当于内存划分的一个个数，那么划分成多少份，这就相当于决定了一个task manager同时可以并行的执行几个task对吧？啊，所以说这相当于我们是通过这个slot的数量可以控制当前task manager的一个并行处理的能力，所以我们说这是一个静态能力。
16:09
也就是说这个能力有是已经有了，但未必要用起来啊，就直接你可以把它放在这儿，我可以不用，这个是完全没问题的啊，这里边我们就先给大家把这个并行度和帕斯manager，还有这个lot的概念先给大家做一个梳理讲解。

展开

我来说两句

0 条评论

登录后参与评论

作者

腾讯云开发者课程

【合辑】尚硅谷Flink从入门到实战（scala版）

（15/137）

10分49秒

001.尚硅谷_Flink-Flink简介

500

19分45秒

002.尚硅谷_Flink-Flink应用场景

480

11分3秒

003.尚硅谷_Flink-流式处理的提出

370

15分16秒

004.尚硅谷_Flink-流式处理的演变

340

16分33秒

005.尚硅谷_Flink-Flink的特点

340

23分57秒

006.尚硅谷_Flink-批处理wordcount

520

20分13秒

007.尚硅谷_Flink-流处理wordcount

370

19分14秒

008.尚硅谷_Flink-流处理wordcount扩展测试和说明

410

26分46秒

009.尚硅谷_Flink-Flink集群部署

470

22分34秒

010.尚硅谷_Flink-提交Job

400

7分30秒

011.尚硅谷_Flink-命令行提交Job

350

12分50秒

012.尚硅谷_Flink-其它方式集群部署

360

8分35秒

013.尚硅谷_Flink-运行时架构_运行时组件

380

13分22秒

014.尚硅谷_Flink-运行时架构_作业提交流程

420

16分27秒

015.尚硅谷_Flink-运行时架构_任务调度原理（一）_并行度和slot

350

17分22秒

016.尚硅谷_Flink-运行时架构_任务调度原理（二）_slot共享

460

6分15秒

017.尚硅谷_Flink-运行时架构_任务调度原理（三）_slot共享示例

290

25分35秒

018.尚硅谷_Flink-运行时架构_任务调度原理（四）_执行图和任务链

290

12分20秒

019.尚硅谷_Flink-运行时架构_任务调度原理（五）_自定义任务调度规则

340

16分18秒

020.尚硅谷_Flink-流处理API_Source（一）_从集合和文件读取数据

380

21分32秒

021.尚硅谷_Flink-流处理API_Source（二）_从Kafka读取数据

430

24分49秒

022.尚硅谷_Flink-流处理API_Source（三）_自定义Source

410

6分49秒

023.尚硅谷_Flink-流处理API_Transform（一）_简单转换算子

320

19分15秒

024.尚硅谷_Flink-流处理API_Transform（二）_简单分组聚合

380

11分20秒

025.尚硅谷_Flink-流处理API_Transform（三）_reduce聚合

320

12分23秒

026.尚硅谷_Flink-流处理API_Transform（四）_分流操作

350

19分54秒

027.尚硅谷_Flink-流处理API_Transform（五）_合流操作

290

9分39秒

028.尚硅谷_Flink-流处理API_Flink支持的数据类型

420

19分40秒

029.尚硅谷_Flink-流处理API_函数类和富函数类

280

18分54秒

030.尚硅谷_Flink-流处理API_Sink（一）_文件

410

10分44秒

031.尚硅谷_Flink-流处理API_Sink（二）_Kafka

430

18分29秒

032.尚硅谷_Flink-流处理API_Sink（三）_Redis

360

16分42秒

033.尚硅谷_Flink-流处理API_Sink（四）_ElasticSearch

350

17分47秒

034.尚硅谷_Flink-流处理API_Sink（五）_MySQL

480

7分21秒

035.尚硅谷_Flink-流处理API_Window API_窗口概念

360

10分12秒

036.尚硅谷_Flink-流处理API_Window API_窗口类型

330

27分16秒

037.尚硅谷_Flink-流处理API_Window API_窗口分配器

450

20分59秒

038.尚硅谷_Flink-流处理API_Window API_窗口函数及其它可选API

410

15分5秒

039.尚硅谷_Flink-流处理API_Window API_窗口计算测试

270

17分56秒

040.尚硅谷_Flink-时间语义

300

4分32秒

041.尚硅谷_Flink-时间语义的设置

350

19分5秒

042.尚硅谷_Flink-Watermark概念

370

15分56秒

043.尚硅谷_Flink-Watermark原理和特点

320

8分7秒

044.尚硅谷_Flink-Watermark传递

260

16分32秒

045.尚硅谷_Flink-Watermark代码中引入

290

7分8秒

046.尚硅谷_Flink-自定义Watermark生成机制

290

16分10秒

047.尚硅谷_Flink-事件时间语义下的窗口测试

360

9分20秒

048.尚硅谷_Flink-窗口起始点的确定

360

8分7秒

049.尚硅谷_Flink-状态管理（一）_状态的概念

400

15分13秒

050.尚硅谷_Flink-状态管理（二）_算子状态和键控状态

290

27分24秒

051.尚硅谷_Flink-状态管理（三）_状态在代码中的定义和使用

330

17分14秒

052.尚硅谷_Flink-状态编程示例（一）

380

17分29秒

053.尚硅谷_Flink-状态编程示例（二）

410

23分23秒

054.尚硅谷_Flink-ProcessFuntion_基本概念和使用

360

32分49秒

055.尚硅谷_Flink-ProcessFuntion_定时器应用示例

320

9分44秒

056.尚硅谷_Flink-ProcessFuntion_侧输出流应用示例

360

15分35秒

057.尚硅谷_Flink-状态后端

390

13分30秒

058.尚硅谷_Flink-容错机制_检查点概念和原理

280

25分45秒

059.尚硅谷_Flink-容错机制_检查点算法

380

26分28秒

060.尚硅谷_Flink-容错机制_checkpoint配置

350

8分20秒

061.尚硅谷_Flink-容错机制_重启策略配置

440

7分31秒

062.尚硅谷_Flink-保存点

460

10分45秒

063.尚硅谷_Flink-状态一致性_基本概念

400

8分42秒

064.尚硅谷_Flink-状态一致性_Flink端到端状态一致性的保证

390

23分34秒

065.尚硅谷_Flink-状态一致性_幂等写入和事务写入

410

18分19秒

066.尚硅谷_Flink-状态一致性_Flink与Kafka连接的状态一致性

400

22分2秒

067.尚硅谷_Flink-Table API和Flink SQL_基本概念和示例程序

400

9分21秒

068.尚硅谷_Flink-Table API和Flink SQL_基本程序结构

340

15分42秒

069.尚硅谷_Flink-Table API和Flink SQL_表执行环境

360

19分13秒

070.尚硅谷_Flink-Table API和Flink SQL_表的概念和从文件读取数据

410

9分28秒

071.尚硅谷_Flink-Table API和Flink SQL_从Kafka读取数据

340

11分3秒

072.尚硅谷_Flink-Table API和Flink SQL_表的查询转换

390

8分24秒

073.尚硅谷_Flink-Table API和Flink SQL_DataStream和表的转换

400

25分13秒

074.尚硅谷_Flink-Table API和Flink SQL_输出到文件

320

10分50秒

075.尚硅谷_Flink-Table API和Flink SQL_更新模式

310

17分40秒

076.尚硅谷_Flink-Table API和Flink SQL_Kafka管道测试

380

18分17秒

077.尚硅谷_Flink-Table API和Flink SQL_输出到ES

340

8分8秒

078.尚硅谷_Flink-Table API和Flink SQL_输出到MySQL

390

11分33秒

079.尚硅谷_Flink-Table API和Flink SQL_表转换成流

290

7分6秒

080.尚硅谷_Flink-Table API和Flink SQL_流处理和SQL查询的不同

340

12分23秒

081.尚硅谷_Flink-Table API和Flink SQL_动态表和持续查询

430

12分49秒

082.尚硅谷_Flink-Table API和Flink SQL_持续查询示例具体过程

410

20分15秒

083.尚硅谷_Flink-Table API和Flink SQL_时间特性（一）_处理时间

340

14分15秒

084.尚硅谷_Flink-Table API和Flink SQL_时间特性（二）_事件时间

330

13分10秒

085.尚硅谷_Flink-Table API和Flink SQL_窗口（一）_分组窗口

440

18分42秒

086.尚硅谷_Flink-Table API和Flink SQL_窗口（二）_分组窗口测试

400

11分57秒

087.尚硅谷_Flink-Table API和Flink SQL_窗口（三）_Over窗口

380

13分1秒

088.尚硅谷_Flink-Table API和Flink SQL_窗口（四）_Over窗口测试

340

11分3秒

089.尚硅谷_Flink-Table API和Flink SQL_函数（一）_系统内置函数

310

14分38秒

090.尚硅谷_Flink-Table API和Flink SQL_函数（二）_UDF函数_标量函数

430

17分18秒

091.尚硅谷_Flink-Table API和Flink SQL_函数（三）_UDF函数_表函数

350

26分57秒

092.尚硅谷_Flink-Table API和Flink SQL_函数（四）_UDF函数_聚合函数

410

27分55秒

093.尚硅谷_Flink-Table API和Flink SQL_函数（五）_UDF函数_表聚合函数

370

8分11秒

094.尚硅谷_Flink项目-电商用户行为分析_批处理和流处理以及项目选型

350

15分26秒

095.尚硅谷_Flink项目-电商用户行为分析_用户行为分析应用场景

370

9分11秒

096.尚硅谷_Flink项目-电商用户行为分析_模块设计和数据分析

440

21分2秒

097.尚硅谷_Flink项目-电商用户行为分析_模块需求分析_实时热门商品统计（一）

350

9分6秒

098.尚硅谷_Flink项目-电商用户行为分析_模块需求分析_实时热门商品统计（二）

400

10分2秒

099.尚硅谷_Flink项目-电商用户行为分析_模块需求分析_其它需求

400

100

10分20秒

100.尚硅谷_Flink项目-电商用户行为分析_项目框架搭建

380

101

27分53秒

101.尚硅谷_Flink项目-电商用户行为分析_实时热门商品统计（一）_窗口聚合

360

102

27分13秒

102.尚硅谷_Flink项目-电商用户行为分析_实时热门商品统计（二）_排序统计输出

390

103

20分50秒

103.尚硅谷_Flink项目-电商用户行为分析_实时热门商品统计（三）_从Kafka消费数据测试

450

104

10分2秒

104.尚硅谷_Flink项目-电商用户行为分析_实时热门商品统计（四）_批量消费Kafka数据测试

480

105

28分42秒

105.尚硅谷_Flink项目-电商用户行为分析_实时热门商品统计（五）_Table API和SQL实现

350

106

26分5秒

106.尚硅谷_Flink项目-电商用户行为分析_实时热门页面流量统计（一）_开窗聚合统计

250

107

9分46秒

107.尚硅谷_Flink项目-电商用户行为分析_实时热门页面流量统计（二）_统计结果排序输出

350

108

21分3秒

108.尚硅谷_Flink项目-电商用户行为分析_实时热门页面流量统计（三）_乱序数据的处理

420

109

21分40秒

109.尚硅谷_Flink项目-电商用户行为分析_实时热门页面流量统计（四）_保证状态更新结果正确

390

110

20分38秒

110.尚硅谷_Flink项目-电商用户行为分析_PV统计（一）_基本实现

420

111

19分21秒

111.尚硅谷_Flink项目-电商用户行为分析_PV统计（二）_数据并行的优化

320

112

15分27秒

112.尚硅谷_Flink项目-电商用户行为分析_UV统计（一）_基本实现

430

113

30分47秒

113.尚硅谷_Flink项目-电商用户行为分析_UV统计（二）_布隆过滤器去重思路和程序架构

350

114

9分11秒

114.尚硅谷_Flink项目-电商用户行为分析_UV统计（三）_布隆过滤器简单实现

340

115

23分31秒

115.尚硅谷_Flink项目-电商用户行为分析_UV统计（四）_UV去重的布隆过滤器实现

300

116

17分2秒

116.尚硅谷_Flink项目-电商用户行为分析_APP市场推广统计（一）_自定义数据源

480

117

20分43秒

117.尚硅谷_Flink项目-电商用户行为分析_APP市场推广统计（二）_开窗聚合统计输出

320

118

19分18秒

118.尚硅谷_Flink项目-电商用户行为分析_广告点击量统计分析（一）_基本需求实现

310

119

14分27秒

119.尚硅谷_Flink项目-电商用户行为分析_广告点击量统计分析（二）_刷单行为过滤思路和整体框架

380

120

23分19秒

120.尚硅谷_Flink项目-电商用户行为分析_广告点击量统计分析（三）_刷单行为过滤代码实现

360

121

18分16秒

121.尚硅谷_Flink项目-电商用户行为分析_恶意登录检测（一）_实现思路和代码框架

400

122

18分20秒

122.尚硅谷_Flink项目-电商用户行为分析_恶意登录检测（二）_具体代码实现

350

123

18分18秒

123.尚硅谷_Flink项目-电商用户行为分析_恶意登录检测（三）_代码改进

350

124

30分32秒

124.尚硅谷_Flink项目-电商用户行为分析_恶意登录检测（四）_CEP代码实现

330

125

12分22秒

125.尚硅谷_Flink项目-电商用户行为分析_CEP简介（一）_CEP介绍及Pattern API整体概念

390

126

12分40秒

126.尚硅谷_Flink项目-电商用户行为分析_CEP简介（二）_个体模式

300

127

10分22秒

127.尚硅谷_Flink项目-电商用户行为分析_CEP简介（三）_模式序列

390

128

9分49秒

128.尚硅谷_Flink项目-电商用户行为分析_CEP简介（四）_模式的检测和事件处理

380

129

19分49秒

129.尚硅谷_Flink项目-电商用户行为分析_订单超时检测（一）_实现思路和程序架构

340

130

17分28秒

130.尚硅谷_Flink项目-电商用户行为分析_订单超时检测（二）_CEP具体代码实现

440

131

6分41秒

131.尚硅谷_Flink项目-电商用户行为分析_订单超时检测（三）_流式输入数据测试

390

132

32分19秒

132.尚硅谷_Flink项目-电商用户行为分析_订单超时检测（四）_ProcessFunction代码实现

380

133

13分48秒

133.尚硅谷_Flink项目-电商用户行为分析_双流实时对账（一）_需求分析和整体架构

350

134

22分23秒

134.尚硅谷_Flink项目-电商用户行为分析_双流实时对账（二）_合流代码实现

380

135

12分55秒

135.尚硅谷_Flink项目-电商用户行为分析_Join API（一）_Window Join

380

136

9分46秒

136.尚硅谷_Flink项目-电商用户行为分析_Join API（二）_Interval Join

240

137

9分21秒

137.尚硅谷_Flink项目-电商用户行为分析_双流实时对账（三）_Join代码实现

330

015.尚硅谷_Flink-运行时架构_任务调度原理（一）_并行度和slot

我来说两句

作者

相关推荐

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐