文章/答案/技术大牛

发布

首页视频066.尚硅谷_Flink-状态一致性_Flink与Kafka连接的状态一致性

066.尚硅谷_Flink-状态一致性_Flink与Kafka连接的状态一致性

2022-12-022022-12-02 16:02:28播放40

点赞0 收藏 0

尚硅谷大数学科--选学技术丰富/尚硅谷Flink从入门到实战（scala版）/视频/066.尚硅谷_Flink-状态一致性_Flink与Kafka连接的状态一致性.mp4

原链接：http://www.atguigu.com/

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:00
接下来我们来给大家再总结一下不同的S和think啊，呃，在这些特点下，我们能够保证的状态一致性，端到端的状态一致性能达到什么级别，那这里边我们区分就是要看，首先看S是什么样的，然后看think，那S这里边主要分两类，一一部分就是不可重置偏移量的，另外还有一类可重置，那如果不可重置偏移量的话，大家就想到了，这个就没什么好说了，整个任务就有可能就是数据就有可能丢掉啊，所以说它最多也就是达到at most once的状态一致性保证，这个就是没有什么好说的啊，不管什么样的think，不管我们flink内部checkpoint机制到底多么的完完善，这里边都有可能丢数据，因为它不能重置嘛啊，那所以接下来我们的讨论其实主要都是基于source可重置的这种状态下来说的，那这里边如果说它这这个S可重置偏移量的话，我们会发现它至少就能达到at。
01:00
办了对吧？呃，因为可重置，那至少我们这个SS任务提重新提交偏移量之后就可以保证数据不丢，所以至少是at least once，那么呃，这里边think任意情况下都是at least once，那接下来我们要考虑的是什么情况下能够达到exactly one呢？有几种情况都能达到，就是密等提交的时候能够达到exactly one，但是大家要注意在故障恢复的时候会出现暂时的不一致，对吧？就是我们说的好像是那个呃，要回回退到之前的某一个状态，好像历史会回滚一下，重演一下，然后之后追上现在，呃，就是故障恢复点的那个状态之后，后面就一样，所以说整体上来讲最终的结果是一个F，但是呢，呃，中间那个过程好像看起来有点奇怪，这是密等的提交，而这个预写日志wal的这种方式呢，诶我们说它这个是at least ones，为什么呢？因为在你假如说。
02:00
后续没有那个事务保证的话，呃，那你只是一个批量提交的话，这里边其实还是不能保证在提交过程当中，如果挂掉的话，是不是会出现重新写入的情况，对吧？哎，所以在这种情况下，我们这里边就是最终你保证的还是at least one，但是其实我们会想到就是你你从跟这个整个这个运行的集群挂掉的这种故障相比，在提交一批数据的过程当中，刚好挂掉这个概率其实比较小，对吧。所以说它只是在这种比较小的情况下，出现了这种比较极端的情况，他是at least once，但是在大多数情况下，大家可以认为啊，他是一个。就是exactly对吧？啊，所以在有些场景下也还是不错的，也是一个选择对吧，就是它实现起来比较简单嘛，啊那更加好的一种方式，那就是两阶段提交，你真正的开启一个事物绑定到checkpoint上，这就是最终完美的实现了，That one好，那接下来我们再来给大家看一看，就是弗link跟卡夫卡他们连接起来的，这样的系统是怎么保证端到端状态一致性的啊那我们说这个，呃，在内部的保证呢，当然就是checkpoint了，对吧？呃，这就是flink内部利用checkpoint保证了状态的一致性，一个大罐S，然后呢，呃，S端呢，我们知道卡用这个连接器里边给我们提供的卡夫卡consumer对吧？呃，这个弗link卡夫卡consumer它其实是可以把。
03:35
偏移量作为状态保存下来的，而且呢，出现故障的时候，它可以自动帮我们按照就读取出来的那个状态作为偏移量重新向连接的那个卡夫卡集群去做提交啊，那这个时候就相当于我们可以重重重放数据对吧，保证数据不丢啊，这就至少能达到这个要求了，然后接下来关键的一个点就在于think，那think是怎么做的呢？之前我们在代码里边也曾经看到过，对于这个卡夫卡当前的这个提交而言。
04:10
我们在看到这个里边，呃，是在做这个S的时候啊。卡夫卡的think里边看到引入的这个弗Li卡夫卡producer，它的底层实现其实是，呃，之前我们说它是一个这个to face commit think方式就实现了这个接口，对不对啊，所以说利用这样一个接口实现了两阶段的事务提交，把当前我们的这个checkpoint机制跟提交事物的过程绑定在一起，这样就完美的实现了端到端的状态一致性，Exactly one状态一致性啊，那具体来看的话，这个整个的这个过程又是什么样的呢？我们用几张图来给大家说明一下啊，呃，首先我们这里边这张图里边有几个重要的组件，我们看到有manager manager在这个过程当中起什么作用呢？它主要是就我们说的协调调度，对吧？Checkpoint主要是由它来做协调调度的，然后另外还有一个是stay back end stay，大家知道本身本地的状态是存在里边的，然后呢。
05:17
啊，呃，就是就是不同的stay back end，它会存到不同的地方，对吧？然后呢，做这个checkpoint的时候呢，它又会把对应的这个状态直接保存到不同的这个持久化存储空间里面去啊，前提是你是file system的，或者是rock DB的这种back啊，啊，所以它主要起的作用就是保存啊，这是另外重要的一个组件，那接下来还有很重要的就是外部的source系统卡不卡对吧？呃，外部的S系统卡不卡，卡不卡，进卡夫卡出，中间是flink内部的各各个任务，我们主要考虑的就是S任务，S任务还有中间的各种转换操作，Transform，这里边我们举的例子是一个window的计算啊，这里边接下来我们就来看到底是应该做什么样的，这样的一个数据来了之后，到底要做什么样的行为了啊，再给大家梳理一遍流程，首先啊，接下来大家看到我们这说的就是预体交接。
06:17
段啊，就是一开始都没有真正提交的时候，首先我们的这个考虑是前面的这个数据不停的来，这个我们就不说了啊，接下来数据来了之后就是一个来一个处理一个来一个处理一个，对吧，这个阶段都是预提交阶段，然后接下来关键一个点是drop manager这边发出了一个指令，告诉source任务，现在我要去触发一次checkpoint的保存操作，那接下来就相当于S这里S任务这里边就注入了一个barrier对吧？啊，就在当前的这个data flow里边，数据流里边接着就注入了一个barrier，然后barrier就按照之前我们说的，哎，要去做这个barrier对齐对吧？然后向下游广播，按照我们定义的那个规则，跟着数据流不停的在算子任务间朝下游传递，所以呃，就是首先我们SS任务接到了这个barrier之后啊，他是先要把自己的当前的状态做一个保存，那他的状态是什么。
07:17
当然就是当前偏一亮了，对吧？把自己的offset做一个保存，写到状态后端里面去，然后接下来把这个barrier朝下游传递，接下来就继续读数啊，这个就不管了，对吧？当然这里面还有一个呃操作就是他要做完了之后，我们说他要通知一下draw manager对吧？告诉draw manager，好，我已经搞定了啊，那draw manager这这边呢，他会确认说当前这个checkpoint搞定吗？当然不会，我们说checkpoint完成标志是所有任务都完成对吧？Drop manager去确认他完成这个才算完成，所以现在还没有，只是S任务搞定了，然后接下来呢，呃，这个就是window任务，收到了这个barrier，他把前面数据全处理完成之后，接到barrier的时候，同样也是保存自己的这个状态到状态后端，呃，然后做快照对吧，那做完了之后呢，我们就把这一个再通知通知给这个draw manager说好我做完了，然后再把Barry朝下游继续传递。每一。
08:17
任务都这么样去做，那我们说等到恢复的时候呢，Checkpoint从这个状态后端里面读取出来，恢复状态就可以保证内部的状态一致性，就是每一步操作都是这样的一个做法，对吧？直到这个think任务也是这样，他也是把自己的任务状态做一个保存，然后通知drop manager，我这边已经完成了，而且接下来大家看啊，这里边有一个这个操作就是pre到外部的这个系统，那这里大家要注意啊，这个过程其实并不是说这个Barry来了之后，他他要做这个操作，而是说什么呢？是之前所有的数据，每一条数据来了之后，是不是都是通过这个预提交pre commit。
09:01
直接来一个处理一个就输出到外部卡夫卡里面去了啊，就是这样的一个过程对吧？啊这个并没闲着，然后现在注意啊，现在我们是遇到一个barrier之后，现在应该要怎么样了呢？啊，现在遇到这个barrier之后，接下来是要真正的去commit这个transaction啊，但是这里边还需要等一个信息对吧？诶就是大家会觉得这个我我感觉应该是这里边这个think任务，遇到接收到这个barrier之后，就应该去提交这个，呃，当当当前的这个呃，这个事务了，但其实不是这样的，大家要把这个流程捋清楚啊，这个过程其实是什么呢？之前我们的所有的数据一个一个来，这当前是一号拆point的，对吧，之前的这个数据大家注意啊，就是都会保存在一个什么里边啊，就是我们说的一个事物里边，对吧，这个我们叫一不是保存在事物啊，就是通过这个一做预提交，提交到这里。
10:02
对吧，一个一个都提交到这里面来，然后大家注意啊，我这里边think任务接收到这个一号拆的barri的时候，我要做一件什么事呢？我直接把这个直接直接这个就呃事务就关闭吗？大家注意不是啊，因为当前这个这个事物你关闭的条件是什么？是要当前的checkpoint真正完成，对吧？当然你可以认为说啊，我已经是think任务在做这个保存了，我保存完了之后，我就可以认为是已经全保存完了，我可以去提交了，但不是的。那因为我们说这个各个任务之间，他们就是互相都不影响对吧，都不挨着，所以说你在做这个处理的时候，别人也在同时做处理啊，有可能会出现什么事儿呢？前面window操作，我做这个拆框里的保存的时候，他的那个任务状态特别多，状态特别多，就有可能占的时间长，对吧？那就有可能会出现什么什么事情啊，就是我这里边在就是假如说我开启了那个异物保存，那大家想我这里边是不是还在保存的过程当中，拆point没完成，但是呢？哎，当前的那个那个barrier和后面的数据都已经往下游传递了，对吧？所以就有可能会出现thinkin任务都已经保存完了，前面还没保存完，是有可能出现这种情况，或者说我们考虑这个并行任务的时候也是这样对吧，你并行自己这个已经完成的话，别人不一定完成啊，你现在这个拆呢，并没有完成完全搞定的，那这个怎么办呢？这里边并不能直接提交。
11:40
关闭上一个事物，直接提交我们的，呃，当前的这个任务，而是得怎么样呢？在这里我作为分界线重新开启下一个新的事物transaction to，大家注意啊，Barrier的标志是表示我现在要开启下一个新的事务，然后怎么样呢？哎，接下来来的这个数据照常来了之后，哎，就是上一个这个CTION1就不再去接收事事务了，对吧？不再去接收这个，呃，数据的这个写入就不再去提交到这个事物里了，而是后边的这个数据都通过transaction to这个事物去做提交了，预提交，这也是预提交对吧？啊，那到底是什么时候我这个transaction one真正的去提交呢？那就是我们说所有任务都已经处理完成之后，Job manager这里边在给他发出确认信息的时候，这个时候我再正式的提交。
12:40
当前的，呃，所有的这个就是当前真正的确认当前的这个transaction事务，把它关闭，然后正正式的提交所有的数据，这才是完整的一个过程啊，所以说就是真正关闭事务啊，确认提交的这个时间点并不是我们前面收到Barry的那个时间点，而是要等招班的通知。
13:05
啊，所以这里边你就会发现之前那个卡夫卡里边的数据，我们不是有一个那个呃，就是隔离级别吗？对吧？呃，我我们它本身的那个有一个呃，就是有一个comted的，有一个TED的对吧？我们可以去去把它这个做一个配置，那之前本来的所有的数据应该默认你提交之后应该是一个就是未提交未确认的一个状态，对吧？尽管这个数已经在卡夫卡里边了，那现在提正式提交关闭事务，那就相当于卡夫卡里边的数据就变成已确认的状态了，对吧？啊就是这样的一个过程啊，当然这里边我们会发现，其实对这个呃，外部的这个卡夫卡要求还是有的，为什么呢？啊，因为首先是一个我们想到的就是外部的那个隔离级别啊，就是呃所所谓的那个呃，Isol isolation level，你必须要设定成一个read committee的，对吧，就是外部卡不卡那个。
14:05
的消费数据的话，必须只能读那个已经确认的数据，你如果要是说我们这里边未确认的数据，尽管已经提交到唐卡了，结果外边的那个应用程序直接就要消费，直接就把它读出来的话，那不就又相当于是我们这里边的状态一致性没有保证了嘛，对吧，又有可能读到会被取消的那个数据嘛，对吧，就相当于你那个转账一样，你如果转到一半，中间那个挂了，你直接读这个数，那不是又会导致后续有可能回滚之后这个数据就是错的吗？啊，所以这里边必须隔离级别是读取这个啊，就是已提交的数据，Read committee，那另外还有一个要求，就是说我们前面提到的那个。超时时间对吧，就是外部的那个超时时间，呃，在这个卡夫卡的本身的设置配置里边，默认的这个超时时间其实是一个，呃，应该是一个一小，呃，就是应该是一个15分钟的一个超时时间，而我们在很尴尬啊，就是内部做这个S任务的过程当中，这边我们等等等那个checkpoint的这个过程当中啊，它默认的那个超时时间是15分钟，所以如果要是这样的话，那会。
15:16
呃，对，就是外边是15分钟，内部是一个小时，所以这会导致一个什么问题呢？就是里边我们等那个拆point等的时候，我可以等一个小时，一直等他在那边，呃，这个完成这个checkpoint，我这边这个任务才会去超时关闭，对吧？那所以这边checkpoint没完成，我可以一直等，但是卡夫卡那边呢，诶有可能就15分钟就到点就直接关闭事误了，那就会导致前面我们说的，哎就就有可能导致这个就是真的是呃，你这边拆你的最后认为他写成功了，但是这里面没有写进去，最后回滚了，导致数据丢失，所以为了满足这种条件啊，避免这种情况出现，当是一般情况你拆能做15分钟以上，说实话这个呃，那那就不要做了吧，对吧，一般情况我们那个拆的那个超时时间可以把这种情况搞定啊，呃，但是这个你就要注意一下，至少你这个配置不要比那个15分钟少，呃，就是这要至少要。
16:17
哦，比那个15分钟要能hold得住，对吧，要不就是checkpoint的超时时间要比那个要小，至少checkpoint就提前挂了，要不呢，就是这里边你还得配那个think任务里边开启，就是连接器里边开启事物的那个默认的超时时间啊，这个就是稍微还是有点麻烦啊。好，那再给大家总结一下的话，整体来讲两阶段提交啊，弗利格跟卡夫塔之间两个阶段提交是什么样的呢？那就是第一个数据来了之后，我们就应该先开启一个事，对吧，这是，然后接下来所有数据的提交，那就都是提交到里边，就是这样的一个过程，然后接下来怎么办呢？接下来是就触发那个那个操作，那么任务里边注入了一个barrier barrier就朝下传递，所有遇到barrier的任务就开始保存状态，保存完了同时找manage，那think任务收到这个barrier的时候干什么呢？它也是先保存状态对吧？呃，然后通知job manager，但是我们可能会想到你收到这个barri了，该关闭这个任务了，对吧，他不是，他是开启下一个。
17:32
传CTION2，然后这个我们叫做分界线了，分界线就是前边的保存到传CTION1里边，后边的就保存到传ACTION2里边去了，但它表示的是TRANSACTION1不再接收数据了，而不是说TRANSACTION1直接关闭，那它到底什么时候关闭呢？他要等job manager确认的通知对吧？啊，那个整体来讲，我们认为正常情况下应该是差不多的时间，我这边接收到我自己保存完成之后，那就应该招manager，那边就他是最后一个操作嘛，就应该是都完成了，对吧？啊，就应该是差不多时间这边就可以关闭了，所以接下来所有的数据就正式提交，就可以使用了，就可以正常消费了，这就是一个完整的两阶段提交的过程。

展开

我来说两句

0 条评论

登录后参与评论

作者

腾讯云开发者课程

【合辑】尚硅谷Flink从入门到实战（scala版）

（66/137）

10分49秒

001.尚硅谷_Flink-Flink简介

500

19分45秒

002.尚硅谷_Flink-Flink应用场景

480

11分3秒

003.尚硅谷_Flink-流式处理的提出

370

15分16秒

004.尚硅谷_Flink-流式处理的演变

340

16分33秒

005.尚硅谷_Flink-Flink的特点

340

23分57秒

006.尚硅谷_Flink-批处理wordcount

520

20分13秒

007.尚硅谷_Flink-流处理wordcount

370

19分14秒

008.尚硅谷_Flink-流处理wordcount扩展测试和说明

410

26分46秒

009.尚硅谷_Flink-Flink集群部署

470

22分34秒

010.尚硅谷_Flink-提交Job

400

7分30秒

011.尚硅谷_Flink-命令行提交Job

350

12分50秒

012.尚硅谷_Flink-其它方式集群部署

360

8分35秒

013.尚硅谷_Flink-运行时架构_运行时组件

380

13分22秒

014.尚硅谷_Flink-运行时架构_作业提交流程

420

16分27秒

015.尚硅谷_Flink-运行时架构_任务调度原理（一）_并行度和slot

350

17分22秒

016.尚硅谷_Flink-运行时架构_任务调度原理（二）_slot共享

460

6分15秒

017.尚硅谷_Flink-运行时架构_任务调度原理（三）_slot共享示例

290

25分35秒

018.尚硅谷_Flink-运行时架构_任务调度原理（四）_执行图和任务链

290

12分20秒

019.尚硅谷_Flink-运行时架构_任务调度原理（五）_自定义任务调度规则

340

16分18秒

020.尚硅谷_Flink-流处理API_Source（一）_从集合和文件读取数据

380

21分32秒

021.尚硅谷_Flink-流处理API_Source（二）_从Kafka读取数据

430

24分49秒

022.尚硅谷_Flink-流处理API_Source（三）_自定义Source

410

6分49秒

023.尚硅谷_Flink-流处理API_Transform（一）_简单转换算子

320

19分15秒

024.尚硅谷_Flink-流处理API_Transform（二）_简单分组聚合

380

11分20秒

025.尚硅谷_Flink-流处理API_Transform（三）_reduce聚合

320

12分23秒

026.尚硅谷_Flink-流处理API_Transform（四）_分流操作

350

19分54秒

027.尚硅谷_Flink-流处理API_Transform（五）_合流操作

290

9分39秒

028.尚硅谷_Flink-流处理API_Flink支持的数据类型

420

19分40秒

029.尚硅谷_Flink-流处理API_函数类和富函数类

280

18分54秒

030.尚硅谷_Flink-流处理API_Sink（一）_文件

410

10分44秒

031.尚硅谷_Flink-流处理API_Sink（二）_Kafka

430

18分29秒

032.尚硅谷_Flink-流处理API_Sink（三）_Redis

360

16分42秒

033.尚硅谷_Flink-流处理API_Sink（四）_ElasticSearch

350

17分47秒

034.尚硅谷_Flink-流处理API_Sink（五）_MySQL

480

7分21秒

035.尚硅谷_Flink-流处理API_Window API_窗口概念

360

10分12秒

036.尚硅谷_Flink-流处理API_Window API_窗口类型

330

27分16秒

037.尚硅谷_Flink-流处理API_Window API_窗口分配器

450

20分59秒

038.尚硅谷_Flink-流处理API_Window API_窗口函数及其它可选API

410

15分5秒

039.尚硅谷_Flink-流处理API_Window API_窗口计算测试

270

17分56秒

040.尚硅谷_Flink-时间语义

300

4分32秒

041.尚硅谷_Flink-时间语义的设置

350

19分5秒

042.尚硅谷_Flink-Watermark概念

370

15分56秒

043.尚硅谷_Flink-Watermark原理和特点

320

8分7秒

044.尚硅谷_Flink-Watermark传递

260

16分32秒

045.尚硅谷_Flink-Watermark代码中引入

290

7分8秒

046.尚硅谷_Flink-自定义Watermark生成机制

290

16分10秒

047.尚硅谷_Flink-事件时间语义下的窗口测试

360

9分20秒

048.尚硅谷_Flink-窗口起始点的确定

360

8分7秒

049.尚硅谷_Flink-状态管理（一）_状态的概念

400

15分13秒

050.尚硅谷_Flink-状态管理（二）_算子状态和键控状态

290

27分24秒

051.尚硅谷_Flink-状态管理（三）_状态在代码中的定义和使用

330

17分14秒

052.尚硅谷_Flink-状态编程示例（一）

380

17分29秒

053.尚硅谷_Flink-状态编程示例（二）

410

23分23秒

054.尚硅谷_Flink-ProcessFuntion_基本概念和使用

360

32分49秒

055.尚硅谷_Flink-ProcessFuntion_定时器应用示例

320

9分44秒

056.尚硅谷_Flink-ProcessFuntion_侧输出流应用示例

360

15分35秒

057.尚硅谷_Flink-状态后端

390

13分30秒

058.尚硅谷_Flink-容错机制_检查点概念和原理

280

25分45秒

059.尚硅谷_Flink-容错机制_检查点算法

380

26分28秒

060.尚硅谷_Flink-容错机制_checkpoint配置

350

8分20秒

061.尚硅谷_Flink-容错机制_重启策略配置

440

7分31秒

062.尚硅谷_Flink-保存点

460

10分45秒

063.尚硅谷_Flink-状态一致性_基本概念

400

8分42秒

064.尚硅谷_Flink-状态一致性_Flink端到端状态一致性的保证

390

23分34秒

065.尚硅谷_Flink-状态一致性_幂等写入和事务写入

410

18分19秒

066.尚硅谷_Flink-状态一致性_Flink与Kafka连接的状态一致性

400

22分2秒

067.尚硅谷_Flink-Table API和Flink SQL_基本概念和示例程序

400

9分21秒

068.尚硅谷_Flink-Table API和Flink SQL_基本程序结构

340

15分42秒

069.尚硅谷_Flink-Table API和Flink SQL_表执行环境

360

19分13秒

070.尚硅谷_Flink-Table API和Flink SQL_表的概念和从文件读取数据

410

9分28秒

071.尚硅谷_Flink-Table API和Flink SQL_从Kafka读取数据

340

11分3秒

072.尚硅谷_Flink-Table API和Flink SQL_表的查询转换

390

8分24秒

073.尚硅谷_Flink-Table API和Flink SQL_DataStream和表的转换

400

25分13秒

074.尚硅谷_Flink-Table API和Flink SQL_输出到文件

320

10分50秒

075.尚硅谷_Flink-Table API和Flink SQL_更新模式

310

17分40秒

076.尚硅谷_Flink-Table API和Flink SQL_Kafka管道测试

380

18分17秒

077.尚硅谷_Flink-Table API和Flink SQL_输出到ES

340

8分8秒

078.尚硅谷_Flink-Table API和Flink SQL_输出到MySQL

390

11分33秒

079.尚硅谷_Flink-Table API和Flink SQL_表转换成流

290

7分6秒

080.尚硅谷_Flink-Table API和Flink SQL_流处理和SQL查询的不同

340

12分23秒

081.尚硅谷_Flink-Table API和Flink SQL_动态表和持续查询

430

12分49秒

082.尚硅谷_Flink-Table API和Flink SQL_持续查询示例具体过程

410

20分15秒

083.尚硅谷_Flink-Table API和Flink SQL_时间特性（一）_处理时间

340

14分15秒

084.尚硅谷_Flink-Table API和Flink SQL_时间特性（二）_事件时间

330

13分10秒

085.尚硅谷_Flink-Table API和Flink SQL_窗口（一）_分组窗口

440

18分42秒

086.尚硅谷_Flink-Table API和Flink SQL_窗口（二）_分组窗口测试

400

11分57秒

087.尚硅谷_Flink-Table API和Flink SQL_窗口（三）_Over窗口

380

13分1秒

088.尚硅谷_Flink-Table API和Flink SQL_窗口（四）_Over窗口测试

340

11分3秒

089.尚硅谷_Flink-Table API和Flink SQL_函数（一）_系统内置函数

310

14分38秒

090.尚硅谷_Flink-Table API和Flink SQL_函数（二）_UDF函数_标量函数

430

17分18秒

091.尚硅谷_Flink-Table API和Flink SQL_函数（三）_UDF函数_表函数

350

26分57秒

092.尚硅谷_Flink-Table API和Flink SQL_函数（四）_UDF函数_聚合函数

410

27分55秒

093.尚硅谷_Flink-Table API和Flink SQL_函数（五）_UDF函数_表聚合函数

370

8分11秒

094.尚硅谷_Flink项目-电商用户行为分析_批处理和流处理以及项目选型

350

15分26秒

095.尚硅谷_Flink项目-电商用户行为分析_用户行为分析应用场景

370

9分11秒

096.尚硅谷_Flink项目-电商用户行为分析_模块设计和数据分析

440

21分2秒

097.尚硅谷_Flink项目-电商用户行为分析_模块需求分析_实时热门商品统计（一）

350

9分6秒

098.尚硅谷_Flink项目-电商用户行为分析_模块需求分析_实时热门商品统计（二）

400

10分2秒

099.尚硅谷_Flink项目-电商用户行为分析_模块需求分析_其它需求

400

100

10分20秒

100.尚硅谷_Flink项目-电商用户行为分析_项目框架搭建

380

101

27分53秒

101.尚硅谷_Flink项目-电商用户行为分析_实时热门商品统计（一）_窗口聚合

360

102

27分13秒

102.尚硅谷_Flink项目-电商用户行为分析_实时热门商品统计（二）_排序统计输出

390

103

20分50秒

103.尚硅谷_Flink项目-电商用户行为分析_实时热门商品统计（三）_从Kafka消费数据测试

450

104

10分2秒

104.尚硅谷_Flink项目-电商用户行为分析_实时热门商品统计（四）_批量消费Kafka数据测试

480

105

28分42秒

105.尚硅谷_Flink项目-电商用户行为分析_实时热门商品统计（五）_Table API和SQL实现

350

106

26分5秒

106.尚硅谷_Flink项目-电商用户行为分析_实时热门页面流量统计（一）_开窗聚合统计

250

107

9分46秒

107.尚硅谷_Flink项目-电商用户行为分析_实时热门页面流量统计（二）_统计结果排序输出

350

108

21分3秒

108.尚硅谷_Flink项目-电商用户行为分析_实时热门页面流量统计（三）_乱序数据的处理

420

109

21分40秒

109.尚硅谷_Flink项目-电商用户行为分析_实时热门页面流量统计（四）_保证状态更新结果正确

390

110

20分38秒

110.尚硅谷_Flink项目-电商用户行为分析_PV统计（一）_基本实现

420

111

19分21秒

111.尚硅谷_Flink项目-电商用户行为分析_PV统计（二）_数据并行的优化

320

112

15分27秒

112.尚硅谷_Flink项目-电商用户行为分析_UV统计（一）_基本实现

430

113

30分47秒

113.尚硅谷_Flink项目-电商用户行为分析_UV统计（二）_布隆过滤器去重思路和程序架构

350

114

9分11秒

114.尚硅谷_Flink项目-电商用户行为分析_UV统计（三）_布隆过滤器简单实现

340

115

23分31秒

115.尚硅谷_Flink项目-电商用户行为分析_UV统计（四）_UV去重的布隆过滤器实现

300

116

17分2秒

116.尚硅谷_Flink项目-电商用户行为分析_APP市场推广统计（一）_自定义数据源

480

117

20分43秒

117.尚硅谷_Flink项目-电商用户行为分析_APP市场推广统计（二）_开窗聚合统计输出

320

118

19分18秒

118.尚硅谷_Flink项目-电商用户行为分析_广告点击量统计分析（一）_基本需求实现

310

119

14分27秒

119.尚硅谷_Flink项目-电商用户行为分析_广告点击量统计分析（二）_刷单行为过滤思路和整体框架

380

120

23分19秒

120.尚硅谷_Flink项目-电商用户行为分析_广告点击量统计分析（三）_刷单行为过滤代码实现

360

121

18分16秒

121.尚硅谷_Flink项目-电商用户行为分析_恶意登录检测（一）_实现思路和代码框架

400

122

18分20秒

122.尚硅谷_Flink项目-电商用户行为分析_恶意登录检测（二）_具体代码实现

350

123

18分18秒

123.尚硅谷_Flink项目-电商用户行为分析_恶意登录检测（三）_代码改进

350

124

30分32秒

124.尚硅谷_Flink项目-电商用户行为分析_恶意登录检测（四）_CEP代码实现

330

125

12分22秒

125.尚硅谷_Flink项目-电商用户行为分析_CEP简介（一）_CEP介绍及Pattern API整体概念

390

126

12分40秒

126.尚硅谷_Flink项目-电商用户行为分析_CEP简介（二）_个体模式

300

127

10分22秒

127.尚硅谷_Flink项目-电商用户行为分析_CEP简介（三）_模式序列

390

128

9分49秒

128.尚硅谷_Flink项目-电商用户行为分析_CEP简介（四）_模式的检测和事件处理

380

129

19分49秒

129.尚硅谷_Flink项目-电商用户行为分析_订单超时检测（一）_实现思路和程序架构

340

130

17分28秒

130.尚硅谷_Flink项目-电商用户行为分析_订单超时检测（二）_CEP具体代码实现

440

131

6分41秒

131.尚硅谷_Flink项目-电商用户行为分析_订单超时检测（三）_流式输入数据测试

390

132

32分19秒

132.尚硅谷_Flink项目-电商用户行为分析_订单超时检测（四）_ProcessFunction代码实现

380

133

13分48秒

133.尚硅谷_Flink项目-电商用户行为分析_双流实时对账（一）_需求分析和整体架构

350

134

22分23秒

134.尚硅谷_Flink项目-电商用户行为分析_双流实时对账（二）_合流代码实现

380

135

12分55秒

135.尚硅谷_Flink项目-电商用户行为分析_Join API（一）_Window Join

380

136

9分46秒

136.尚硅谷_Flink项目-电商用户行为分析_Join API（二）_Interval Join

240

137

9分21秒

137.尚硅谷_Flink项目-电商用户行为分析_双流实时对账（三）_Join代码实现

330

066.尚硅谷_Flink-状态一致性_Flink与Kafka连接的状态一致性

我来说两句

作者

相关推荐

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐