文章/答案/技术大牛

发布

首页视频103.尚硅谷_Flink项目-电商用户行为分析_实时热门商品统计（三）_从Kafka消费数据测试

103.尚硅谷_Flink项目-电商用户行为分析_实时热门商品统计（三）_从Kafka消费数据测试

2022-12-022022-12-02 16:02:28播放45

点赞0 收藏 0

尚硅谷大数学科--选学技术丰富/尚硅谷Flink从入门到实战（scala版）/视频/103.尚硅谷_Flink项目-电商用户行为分析_实时热门商品统计（三）_从Kafka消费数据测试.mp4

原链接：http://www.atguigu.com/

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:00
我们已经把这个代码做了一个完整的实现，大家也看到输出的结果了，那接下来呢，我们在这个代码基础上做一些调整和改进，呃，那其实也没有特别需要改进的地方，大家发现这个流程其实已经很顺了，主要是出于什么考虑呢？大家想到在这个实际生产环境里边，显然不可能数据全已经准备齐了，放在一个文件里边让我们去读，对吧？呃，真正的生产环境我们既然是要做流式的处理，那应该要有一个流式的数据输入，我们这里边应该是源源不断的来，而不是把数据读完了之后，整个处理完了就结束了，这有点像批处理了。所以我这里边要再给大家讲一下，把它的数据源改成卡夫卡，因为我们知道实际生产环境里边流失数据最常见的输入源就是卡夫卡对吧，消息队列啊，所以接下来我们把这个助调再做一个卡夫卡，从卡夫卡中读取数据的一个测试。
01:00
读取数据啊，那这个从卡夫卡里面读取数据，大家知道，一开始肯定我还是先要去定义一个proper，有一个proper啊，这个就直接用抓va下边的这个proper，然后里边呢，主要就是哎，传一些这一些配置项，BOO STEM service local host 9092对吧，这是我这里面配置的，另外可能我们配置一些，呃，这个消费者组group ID对吧？啊，你也可以配置一些，比方说这个可序列化工具啊，Key的这个decisionizer value的decisionizer啊，那当然我们前面说过，像这个呃，序列化反序列化工具的话，我们也可以在调用这个就是连接器啊，我们创建那个弗Li卡布卡consumer的时候，里边传一个参数就也可以，呃，给我们规定好当前这个做序列化反序列化的这个方法，对吧？啊，所以这个其实都是可选的，这里我就不详细给大家说了，我们可以直接看一下，呃，文档里边。
02:00
大家看这个替换卡夫卡作为数据源，这里边给的这个参数还挺多，对吧？BOOSTEM，我这里边兹9092GROUP ID给了一个这个消费者组的这个group ID啊，后面还有这个K和value的R，这里还配了一个auto of set reset对吧？呃，就是做这个自动重置的时候，我们直接用最近的，其实这个没必要啊，因为大家知道，呃，就是我们说这个，因为底层有这个故障恢复的保证嘛，那么弗林卡夫卡的连接器，它其实会在发生故障，呃，就是需要去恢复状态的时候呢，直接把自己保存的那个偏移量重新提交，对吧？所以这里边其实你不需要去配置这些东西，那假如说你没有配置，这里边主要是考虑到你，你如果没有配置这个拆point的，没有配置这个重启策略的话，那可能这里边你需要有一个就是就是我们这里边啊，如果要是重新读取的话，从哪里开始，对吧，可能要去定义这样一个，当然就是感兴趣的同学也可以看这个弗林卡consumer的一。
03:00
这配置项啊，它可以直接指定你当前这个偏移量的位置，对吧？啊，就是从哪里啊，Start这个从从哪里去指定这个offset这个都是可以去配的，我们这里面就不给大家详细说了，直接把这个copy过来啊，最后那一行我也不copy了啊，直接拿过来放在这就可以了。呃，这里我们是不是定义的不太一样，Properties在报错是吧？Properties set proper看一眼啊，Properties，然后后边我们接下来要做的其实也非常简单，就是定义一个input stream，然后把从这个env，然后艾source里边要传入的就是一个flink卡夫卡的连接器，大家还记得那个是什么吧？呃，就是flink，呃，卡夫卡，诶，现在大家注意是consumer还是producer呢？现在是要从flink去读，从从卡夫卡去读取数据所应该是一个消费者，而且大家看到现在里边我们不需要去引入那个呃，PRODUCER011了，对吧？呃呃，这这这是producer啊，我们要引入的是consumer，我们直接引入通用连接器，因为当时我们直接引入的通用连接器就不带版本嘛，所以这里边你引入这个消费者的时候，也是直接给这个consumer就可以了。
04:21
然后里边的这个类型，当时我们给大家呃做过这个，就是直接把这个定义成这个string就可以了，对吧？里边传的这个参数呢，最简单的就是前面给一个当前的topic，比方说我这里边叫hot items啊，那后边呢，给一个string，呃，就是最简单的这个simple s对吧？做一个这个当前指定啊，这个的S啊，然后后边再把对应的这个properties传入，对吧？这是非常简单的这个做法，然后这里边我们主要是把这个copy过来之后，上面有两个定义，把这个去掉，上面就不报错了，然后下边对应的参数一个一个传入当前，对于这个呃，卡夫卡连接器啊，一个消费者配置在这里，我们就可以从卡夫卡去读数了。好，然后接下来我们就可以运行去做一个测试了，首先我得看一下卡夫卡是否已经启动起来了，好，没问题，卡夫卡已经在了，对吧。
05:21
然后接下来我们是进入到进入到这个卡下边去要一个R，然后我们这边相当于是一个这里是一个consumer对吧？啊是这样的一个处理流程，所以我可以把这边起起来，代码起起来，然后接下来在这边呢，呃，去启动一个卡夫卡，然后定义一个R啊然后我们定义啊呃，当前这个broke list9092，然后这里边我们定义的是对吧，把这个创建出来，然后就是一条数据一数据入了这个输入数据的这个过程当中，其实就是大家直接把那个对应的那个数据拿出来就行了，但是我们这里面本身数据呢，它那个时间戳进展太慢，对吧。
06:21
这里边它都是一秒一秒跳的，我这里边就找了一些，呃，就是这个测试数据啊，直接给大家快速的把这个做一个做一个测试，这里边就会稍微的容易一些，好我们还是把这个窗口做一个分配，这边的数据我们放在最下边，然后这个窗口放在上面对吧，这里边一条一条输入，大家看我这里边的第一条数据，这个543462这个用户啊，啊对于这个1715这个item，这个商品做了一个浏览操作，PV操作啊，然后这个时间戳是后边这个啊，这个58000啊，我们先把它这条数据输入，然后大家看到这里边没有任何的输出，那很自然啊，当当前你输入第一条数据的时候，并没有窗口关闭嘛，所以当前肯定是什么都没有，然后接下来呢，哎，我们就给一个这个060，大家知道这过了60秒一分钟之后，对吧，那我们看一看当前是一个什么样子啊这。
07:21
复制一下还是没有任何的输出啊，那大家可能会想到接下来我们就继续往后推移了，120，这应该是两分钟之后还是没有输出，那这到底要到什么时候才能输出呢？我的这个数据基本上就是60秒一个，那就是一分钟一个啊，大家会想到这主要就是关系到我们当前的这个数据，哎，到底它是就是我们窗口是以多少，以什么时间开始，以什么时间结束，那我们现在说五分钟一个，滑动一个窗口，对吧，然后一小时呃大小的这个窗口，那它应该是创建出来之后，应该是什么样的状态呢？我们说就应该是整点，然后隔五分钟划一次对吧，那其实就应该是整五分钟一次嘛，每五分钟就要关闭一个窗口，对吧？诶，所以正常来讲，就是比方说八点到九点有一个窗口，那就是九点钟关一个窗口，9.05关一个窗口，09:10关一个窗口，九。
08:21
十物关系出口对吧？那所以这里边我们就关键是考虑当前的这个数据啊，它本身应该是什么时间了啊，那那这个我们如果不管的话，大家只看后边这个000啊，只看后边的这这这么三个零，这就相当于我们前面肯定是一个至少是一个整数对吧？而且我们看一下前面这个这个字段啊，1511658，如果我们大概的看一眼的话，会发现它相加应该是三的整倍数对吧？呃，因为大家知道所有的数字加起来能被三整除，就是三的整倍数，而且是个偶数，也是二的整倍数，那它不就是六的整倍数吗？啊，所以大家知道当前这个肯定它是它是什么呀？就是一个6000的整倍数对吧？这相当于是一个6000的整倍数啊，那肯定它就应该是一个整十分钟对吧？啊，就是600的整倍数，600秒的整倍数，就是一个整分整十分钟吧，啊，所以至少这个。
09:21
个数据，它肯定就是卡在比方说整五整十这个点上输入的一个数据，然后后边呢，诶过一分钟，过两分钟，过三分钟，过四分钟，大家会想到是不是应该是过五分钟，还是卡在一个准准的五分十分的这个这个点上，就可能会输出一个，就有一个窗口应该要关闭了呀，因为我们说每五分钟应该有一个窗口关闭嘛，对吧？哎，我们把这条数据copy下来，没copy上啊，然后在这里做一个输出，但是大家看这里边还是没有任何的结果，哎，那这是怎么回事呢？这就是我们说的，当时我们不是还等了一毫秒，然后才输出，等到所有数据都到齐吗？那你说等一毫秒，现在这个water相当于是到了多少了呢？我们现在升序本身就有一毫秒延迟，对吧？所以你如果现在是到了一个，比方说整五整十分钟对吧，比方说我现在就是9.05，这个数据是9.05，那watermark应该到什么。
10:21
那呢没到9.05，现在是到了，比方说哎，是这个09:04:59，然后哎这个就是999毫秒，对吧，就差一毫秒到了这个时间，所以接下来其实我们当前的这个数据呢，还应该没有统计，就连那个窗口还没有关闭呢，对吧？啊那应该什么时候关闭呢？是不是应该这个时间要再往前推进一下呀？啊对吧？所以这里边我可以去再把这个，我就直接把这条数据啊直接复制一份，大家会想到我直接把这个时间戳再加一，是不是就应该有效果了，对吧？哎，我这里边相当于就往后推迟一秒钟，那是不是所有的这个窗口也应该关闭了，另外就是我当前所有的这个，呃，就当前的窗口关闭了，然后所有的数据都已经统计输出了，这个也已经超过了我们定义的那个定时器加一毫秒的时间了，最后的这个排序是不是。
11:21
直接就输出了对吧？啊，这里边我们是中间加了一行空行啊，所以这里边大家看输出的就相当于这个分割的就会开一点对吧？啊，这里边就能看到当前这是哦，原来这是09:05关了一个窗口，那大家看到这里边窗口数据有哪些数据呢？我们看输入的数据啊，1715这个商品的热门度是二，那家看一七一五一七一五两条数据没毛病对吧？诶然后第二名的是22440742244074，这个数据两条没毛病对吧？然后接下来这个3611281，诶有同学可能就说了，那3611281，这不对啊，这应该是有三条数据啊，你怎么他只有一条数据排排第三呢？
12:06
诶，大家就知道了，当前09:05关的这个窗口，说明这个时间戳应该就是什么呀，是不是就是我们当前这个658300这个时间戳啊，对吧？啊，就是当前这个时间戳表示我们这个09:05这个时间点，所以你看超过它之后，我们这个窗口不就关了吗？哎，那另外我们说是窗口里边是前闭后开，所以当前本身卡在这个09:05这个点上的是这个数据，它不应该属于这个窗口对吧？不属于09:05的窗口，它应该属于下一个窗口啊呃，那那这里面还有就是3301，那已经过了一秒了，09:05:01了，当然也不属于之前这个窗口了，对吧？所以这里面就没有把它统计进去，那我们自然就想到了，后边如果再去输出下一个窗口的话，那应该是什么时候呢？那应该是再过五分钟，那就是加再加300秒600的时候，这里要输出下一个窗口对吧？啊，但是大家知道你给这个六零。
13:06
的时候呢，这里还不会有输出，就是我们说的在这儿它只是呃，这个到了之前前一毫秒的那个时间点，对吧，你这里边如果给一个601才会输出下一个窗口，诶大家看这里边输出了下一个窗口对吧？这里边你看3611281热门度是不是就是三了，前面都统计进来了，对吧？然后这个2274074你会看到，诶这个还是呃。哎，这里看到你，你尽管是多输入了一条数据，但是事实上这个数据没有包括进来对吧？因为它本身已经是09:10:01的那个数据了嘛，所以我们统计的还是之前的两条数据对吧？啊，那1715也是两条数据啊，所以大家可以看到这样的一个效果啊呃，那呃，当然了，如果大家想更加清晰的看到这个效果的话，我们可以在这个代码里边给大家做一个做一个更加明确的展示输出，就是我可以在这里边把这个前面我们不是有data stream吗？我直接把它打印输出，这是每输入一条数据就会输出对吧？呃，然后另外我们中间不是有一个聚合结果AJG吗？也把它做一个打印输出，这里边我们给一个AJG，就是每一个窗口聚合，出现这个聚合结果的时候，我直接把它写在这里，呃，然后另外这个最后的结果，这个叫做这个就不用result了，因为大家知道这个都有这个分割线的嘛，对吧，这里面有分割线看的很明，明显如。
14:33
大家觉得这个这样换行不舒服的话，我们可以把这个换行再放到，就是每一次我们这里边输出结果的时候，把这个再再换换一行，对吧？啊，这个就是相当于整个这个窗口结果都输出之后，最后分割线再换一行显示，然后我们再来运行一下，大家看看这现在的效果是什么样子。好，现在已经提起来了，大家具体在看的更加清楚一点啊，我们我们一条一条数据输入，大家看一眼这个过程，首先这个右面复制上啊，好，这个第一条数据输入进来，大家看有一个塔的入对吧，当前这个数据这个11658000放在这儿了，然后接下来我们知道它不会触发任何的这个窗口操作嘛，060啊，又来一条数据对吧，当然也不会有窗口关闭，然后接下来这个120啊，这个就是一条一条数据，大家知道一分钟一个嘛，这这个数据都不会触发操作，但是这些数据都是里面的一部分，所以说都会来一条数据，就输出一个结果，240，这是已经到四分钟了啊，然后接下来300，注意大家看啊，300这个数据输入，大家看这个300输入之后，它这里面是什么呢？诶大家看这里边，它是直接已经给我们关闭了这个。
15:56
呃，窗口，然后输出了这里的这个聚合结果对不对，但是没有输出我们后续的排序结果，这是为什么呢？哎，这里大家要注意一下，就是我们当前在做这个数据调，就是在在做这个操作的时候啊，相当于是当前的时间已经进展到了这个窗口关闭的时间，对吧？哎，那这里面就涉及到一个问题，我们不是说本来当前这个升序数据处理的过程当中是有一个这个watermark延迟一毫秒的吗？那为什么之前我们这个窗口就可以关闭了呢？大家注意一下啊，我们当时窗口关闭，我们说是要达到这个时间窗口就关闭了，对吧？比方说达到这个呃，我们呃整五分钟的这个这个时间，58300的这个时间点窗口就关闭，那这里面它其实要关闭的这个时间点是什么呢？其实就是窗口所有数据都到齐的时候，我就应该关闭就可以了，对吧。
16:56
那什么时候窗口数据都就都到齐了呢？是water mark1定要涨到这个，呃，58300才可以吗？其实不是，我只要找到它之前一毫秒那个点就是58299999就可以了，因为我当前的窗口里边大家想是不是不包括58300当前的这个，呃，这个这个时间点上的数据啊，哎，我们要的是前闭后开嘛，所以当前我其实要的就是里边的所有数据啊，最大的时间戳就是比它要少一毫秒。
17:34
所以大看如果这里边我来了这个比它少一毫秒的这个时间戳，是不是就可以触发当前的这个，呃，就是当前这个窗口的这个关闭和计算的这个操作啊，所以大家看到底层窗口的这个关闭啊，时间窗口的关闭，它其实也是按照这个减一毫秒的这个时间点去出发的，对吧？啊，所以这里边我们看的很明显，在这儿它输出了一个聚合结果，当前我们这个17152对吧？啊，3611281122440742，这个没问题，我们这里边都已经输出聚合结果了，但是这里边呢，还没有触发后面我们的排序操作，这是为什么呢？这就是我们说的后边又去叠加了一毫秒，对吧？如果说我们不再加那一毫秒的话，那其实在这儿就应该直接输出了，对吧，你给这条数据的时候，就应该直接输出结果了，因为这条数据并不属于我们当前窗口要去统计的数据嘛，对吧，它只是把我们这个时间啊推移到这个点。
18:35
呃，表示窗口可以关闭就OK了啊，所以接下来那怎么样才能让它真正的有这样的一个，呃，最终的这个输出呢？那就是我们把这个再去推移，再朝前去做一个推移，对吧？再来一个301的这个数据，你看这个数据输入进来之后，之前的这个窗口就真的输出这个排序结果了啊，这就是这个完整的一个测试流程啊啊，那后边同样就是你给这个600这条数据的时候，它本身这里边只会输出大家看什么呢？当前600，也就是又过五分钟之后，09:10这个窗口关闭的时候，我统计出来的这个结果，对吧，但是不会输出我当前的排序结果，那什么时候才能输出这个排序结果呢？同样还是给一个601的时候，这里边就会把之前的这个排序结果列出来了啊啊，那有些同学可能想，那呃，假如说我要突然给一个很大的时间戳它会出现什么情况呢。
19:35
啊，就是比方说这这里大家看啊，直接给一个661600，这比我们一开始的这个658000已经是超过了这个58000，这里是，呃，这个61600相当于已经加了3600秒对吧，3600秒就是一小时嘛，我直接如果把这个时间给一个一小时之后的数据的话，这会发生什么事情呢？那就相当于我们系统里边的watermark是不是，是不是就会直接一下子跳变一下呀，对吧，直接跳到一小时之后，诶那大看一下这里的效果是什么样的啊，这条数据输入进来，然后很多窗口都关闭了，大家看58900对吧，呃，这个，然后59200，然后59500啊，就是每隔五分钟这很多窗口都关闭了，统计数据都输出了，然后大家看后面是。
20:27
09:15的结果输出对吧，09:20的结果输出，25分的，30分的每一个最后的统计结果，一直到09:55对吧，一小时之后可以统计输出的这个结果全部都输出啊，这就是这个我们在做这个流式测试的时候啊，大家可以用一个卡夫卡作为数据源，做一个完整的测试。

展开

我来说两句

0 条评论

登录后参与评论

作者

腾讯云开发者课程

【合辑】尚硅谷Flink从入门到实战（scala版）

（103/137）

10分49秒

001.尚硅谷_Flink-Flink简介

510

19分45秒

002.尚硅谷_Flink-Flink应用场景

480

11分3秒

003.尚硅谷_Flink-流式处理的提出

380

15分16秒

004.尚硅谷_Flink-流式处理的演变

350

16分33秒

005.尚硅谷_Flink-Flink的特点

340

23分57秒

006.尚硅谷_Flink-批处理wordcount

520

20分13秒

007.尚硅谷_Flink-流处理wordcount

380

19分14秒

008.尚硅谷_Flink-流处理wordcount扩展测试和说明

410

26分46秒

009.尚硅谷_Flink-Flink集群部署

470

22分34秒

010.尚硅谷_Flink-提交Job

400

7分30秒

011.尚硅谷_Flink-命令行提交Job

350

12分50秒

012.尚硅谷_Flink-其它方式集群部署

360

8分35秒

013.尚硅谷_Flink-运行时架构_运行时组件

390

13分22秒

014.尚硅谷_Flink-运行时架构_作业提交流程

430

16分27秒

015.尚硅谷_Flink-运行时架构_任务调度原理（一）_并行度和slot

360

17分22秒

016.尚硅谷_Flink-运行时架构_任务调度原理（二）_slot共享

470

6分15秒

017.尚硅谷_Flink-运行时架构_任务调度原理（三）_slot共享示例

300

25分35秒

018.尚硅谷_Flink-运行时架构_任务调度原理（四）_执行图和任务链

310

12分20秒

019.尚硅谷_Flink-运行时架构_任务调度原理（五）_自定义任务调度规则

350

16分18秒

020.尚硅谷_Flink-流处理API_Source（一）_从集合和文件读取数据

380

21分32秒

021.尚硅谷_Flink-流处理API_Source（二）_从Kafka读取数据

430

24分49秒

022.尚硅谷_Flink-流处理API_Source（三）_自定义Source

410

6分49秒

023.尚硅谷_Flink-流处理API_Transform（一）_简单转换算子

320

19分15秒

024.尚硅谷_Flink-流处理API_Transform（二）_简单分组聚合

380

11分20秒

025.尚硅谷_Flink-流处理API_Transform（三）_reduce聚合

320

12分23秒

026.尚硅谷_Flink-流处理API_Transform（四）_分流操作

350

19分54秒

027.尚硅谷_Flink-流处理API_Transform（五）_合流操作

290

9分39秒

028.尚硅谷_Flink-流处理API_Flink支持的数据类型

420

19分40秒

029.尚硅谷_Flink-流处理API_函数类和富函数类

280

18分54秒

030.尚硅谷_Flink-流处理API_Sink（一）_文件

410

10分44秒

031.尚硅谷_Flink-流处理API_Sink（二）_Kafka

430

18分29秒

032.尚硅谷_Flink-流处理API_Sink（三）_Redis

360

16分42秒

033.尚硅谷_Flink-流处理API_Sink（四）_ElasticSearch

350

17分47秒

034.尚硅谷_Flink-流处理API_Sink（五）_MySQL

480

7分21秒

035.尚硅谷_Flink-流处理API_Window API_窗口概念

360

10分12秒

036.尚硅谷_Flink-流处理API_Window API_窗口类型

330

27分16秒

037.尚硅谷_Flink-流处理API_Window API_窗口分配器

450

20分59秒

038.尚硅谷_Flink-流处理API_Window API_窗口函数及其它可选API

410

15分5秒

039.尚硅谷_Flink-流处理API_Window API_窗口计算测试

270

17分56秒

040.尚硅谷_Flink-时间语义

300

4分32秒

041.尚硅谷_Flink-时间语义的设置

350

19分5秒

042.尚硅谷_Flink-Watermark概念

370

15分56秒

043.尚硅谷_Flink-Watermark原理和特点

320

8分7秒

044.尚硅谷_Flink-Watermark传递

260

16分32秒

045.尚硅谷_Flink-Watermark代码中引入

290

7分8秒

046.尚硅谷_Flink-自定义Watermark生成机制

290

16分10秒

047.尚硅谷_Flink-事件时间语义下的窗口测试

360

9分20秒

048.尚硅谷_Flink-窗口起始点的确定

360

8分7秒

049.尚硅谷_Flink-状态管理（一）_状态的概念

400

15分13秒

050.尚硅谷_Flink-状态管理（二）_算子状态和键控状态

290

27分24秒

051.尚硅谷_Flink-状态管理（三）_状态在代码中的定义和使用

340

17分14秒

052.尚硅谷_Flink-状态编程示例（一）

380

17分29秒

053.尚硅谷_Flink-状态编程示例（二）

410

23分23秒

054.尚硅谷_Flink-ProcessFuntion_基本概念和使用

360

32分49秒

055.尚硅谷_Flink-ProcessFuntion_定时器应用示例

320

9分44秒

056.尚硅谷_Flink-ProcessFuntion_侧输出流应用示例

360

15分35秒

057.尚硅谷_Flink-状态后端

390

13分30秒

058.尚硅谷_Flink-容错机制_检查点概念和原理

280

25分45秒

059.尚硅谷_Flink-容错机制_检查点算法

380

26分28秒

060.尚硅谷_Flink-容错机制_checkpoint配置

350

8分20秒

061.尚硅谷_Flink-容错机制_重启策略配置

440

7分31秒

062.尚硅谷_Flink-保存点

460

10分45秒

063.尚硅谷_Flink-状态一致性_基本概念

400

8分42秒

064.尚硅谷_Flink-状态一致性_Flink端到端状态一致性的保证

390

23分34秒

065.尚硅谷_Flink-状态一致性_幂等写入和事务写入

410

18分19秒

066.尚硅谷_Flink-状态一致性_Flink与Kafka连接的状态一致性

400

22分2秒

067.尚硅谷_Flink-Table API和Flink SQL_基本概念和示例程序

400

9分21秒

068.尚硅谷_Flink-Table API和Flink SQL_基本程序结构

340

15分42秒

069.尚硅谷_Flink-Table API和Flink SQL_表执行环境

360

19分13秒

070.尚硅谷_Flink-Table API和Flink SQL_表的概念和从文件读取数据

410

9分28秒

071.尚硅谷_Flink-Table API和Flink SQL_从Kafka读取数据

340

11分3秒

072.尚硅谷_Flink-Table API和Flink SQL_表的查询转换

390

8分24秒

073.尚硅谷_Flink-Table API和Flink SQL_DataStream和表的转换

400

25分13秒

074.尚硅谷_Flink-Table API和Flink SQL_输出到文件

320

10分50秒

075.尚硅谷_Flink-Table API和Flink SQL_更新模式

310

17分40秒

076.尚硅谷_Flink-Table API和Flink SQL_Kafka管道测试

380

18分17秒

077.尚硅谷_Flink-Table API和Flink SQL_输出到ES

340

8分8秒

078.尚硅谷_Flink-Table API和Flink SQL_输出到MySQL

390

11分33秒

079.尚硅谷_Flink-Table API和Flink SQL_表转换成流

290

7分6秒

080.尚硅谷_Flink-Table API和Flink SQL_流处理和SQL查询的不同

340

12分23秒

081.尚硅谷_Flink-Table API和Flink SQL_动态表和持续查询

430

12分49秒

082.尚硅谷_Flink-Table API和Flink SQL_持续查询示例具体过程

410

20分15秒

083.尚硅谷_Flink-Table API和Flink SQL_时间特性（一）_处理时间

340

14分15秒

084.尚硅谷_Flink-Table API和Flink SQL_时间特性（二）_事件时间

330

13分10秒

085.尚硅谷_Flink-Table API和Flink SQL_窗口（一）_分组窗口

440

18分42秒

086.尚硅谷_Flink-Table API和Flink SQL_窗口（二）_分组窗口测试

400

11分57秒

087.尚硅谷_Flink-Table API和Flink SQL_窗口（三）_Over窗口

380

13分1秒

088.尚硅谷_Flink-Table API和Flink SQL_窗口（四）_Over窗口测试

340

11分3秒

089.尚硅谷_Flink-Table API和Flink SQL_函数（一）_系统内置函数

310

14分38秒

090.尚硅谷_Flink-Table API和Flink SQL_函数（二）_UDF函数_标量函数

430

17分18秒

091.尚硅谷_Flink-Table API和Flink SQL_函数（三）_UDF函数_表函数

350

26分57秒

092.尚硅谷_Flink-Table API和Flink SQL_函数（四）_UDF函数_聚合函数

410

27分55秒

093.尚硅谷_Flink-Table API和Flink SQL_函数（五）_UDF函数_表聚合函数

370

8分11秒

094.尚硅谷_Flink项目-电商用户行为分析_批处理和流处理以及项目选型

350

15分26秒

095.尚硅谷_Flink项目-电商用户行为分析_用户行为分析应用场景

370

9分11秒

096.尚硅谷_Flink项目-电商用户行为分析_模块设计和数据分析

440

21分2秒

097.尚硅谷_Flink项目-电商用户行为分析_模块需求分析_实时热门商品统计（一）

350

9分6秒

098.尚硅谷_Flink项目-电商用户行为分析_模块需求分析_实时热门商品统计（二）

400

10分2秒

099.尚硅谷_Flink项目-电商用户行为分析_模块需求分析_其它需求

400

100

10分20秒

100.尚硅谷_Flink项目-电商用户行为分析_项目框架搭建

380

101

27分53秒

101.尚硅谷_Flink项目-电商用户行为分析_实时热门商品统计（一）_窗口聚合

360

102

27分13秒

102.尚硅谷_Flink项目-电商用户行为分析_实时热门商品统计（二）_排序统计输出

390

103

20分50秒

103.尚硅谷_Flink项目-电商用户行为分析_实时热门商品统计（三）_从Kafka消费数据测试

450

104

10分2秒

104.尚硅谷_Flink项目-电商用户行为分析_实时热门商品统计（四）_批量消费Kafka数据测试

480

105

28分42秒

105.尚硅谷_Flink项目-电商用户行为分析_实时热门商品统计（五）_Table API和SQL实现

350

106

26分5秒

106.尚硅谷_Flink项目-电商用户行为分析_实时热门页面流量统计（一）_开窗聚合统计

250

107

9分46秒

107.尚硅谷_Flink项目-电商用户行为分析_实时热门页面流量统计（二）_统计结果排序输出

350

108

21分3秒

108.尚硅谷_Flink项目-电商用户行为分析_实时热门页面流量统计（三）_乱序数据的处理

420

109

21分40秒

109.尚硅谷_Flink项目-电商用户行为分析_实时热门页面流量统计（四）_保证状态更新结果正确

390

110

20分38秒

110.尚硅谷_Flink项目-电商用户行为分析_PV统计（一）_基本实现

430

111

19分21秒

111.尚硅谷_Flink项目-电商用户行为分析_PV统计（二）_数据并行的优化

320

112

15分27秒

112.尚硅谷_Flink项目-电商用户行为分析_UV统计（一）_基本实现

430

113

30分47秒

113.尚硅谷_Flink项目-电商用户行为分析_UV统计（二）_布隆过滤器去重思路和程序架构

350

114

9分11秒

114.尚硅谷_Flink项目-电商用户行为分析_UV统计（三）_布隆过滤器简单实现

340

115

23分31秒

115.尚硅谷_Flink项目-电商用户行为分析_UV统计（四）_UV去重的布隆过滤器实现

300

116

17分2秒

116.尚硅谷_Flink项目-电商用户行为分析_APP市场推广统计（一）_自定义数据源

480

117

20分43秒

117.尚硅谷_Flink项目-电商用户行为分析_APP市场推广统计（二）_开窗聚合统计输出

320

118

19分18秒

118.尚硅谷_Flink项目-电商用户行为分析_广告点击量统计分析（一）_基本需求实现

310

119

14分27秒

119.尚硅谷_Flink项目-电商用户行为分析_广告点击量统计分析（二）_刷单行为过滤思路和整体框架

380

120

23分19秒

120.尚硅谷_Flink项目-电商用户行为分析_广告点击量统计分析（三）_刷单行为过滤代码实现

360

121

18分16秒

121.尚硅谷_Flink项目-电商用户行为分析_恶意登录检测（一）_实现思路和代码框架

400

122

18分20秒

122.尚硅谷_Flink项目-电商用户行为分析_恶意登录检测（二）_具体代码实现

350

123

18分18秒

123.尚硅谷_Flink项目-电商用户行为分析_恶意登录检测（三）_代码改进

350

124

30分32秒

124.尚硅谷_Flink项目-电商用户行为分析_恶意登录检测（四）_CEP代码实现

330

125

12分22秒

125.尚硅谷_Flink项目-电商用户行为分析_CEP简介（一）_CEP介绍及Pattern API整体概念

390

126

12分40秒

126.尚硅谷_Flink项目-电商用户行为分析_CEP简介（二）_个体模式

300

127

10分22秒

127.尚硅谷_Flink项目-电商用户行为分析_CEP简介（三）_模式序列

390

128

9分49秒

128.尚硅谷_Flink项目-电商用户行为分析_CEP简介（四）_模式的检测和事件处理

380

129

19分49秒

129.尚硅谷_Flink项目-电商用户行为分析_订单超时检测（一）_实现思路和程序架构

340

130

17分28秒

130.尚硅谷_Flink项目-电商用户行为分析_订单超时检测（二）_CEP具体代码实现

440

131

6分41秒

131.尚硅谷_Flink项目-电商用户行为分析_订单超时检测（三）_流式输入数据测试

390

132

32分19秒

132.尚硅谷_Flink项目-电商用户行为分析_订单超时检测（四）_ProcessFunction代码实现

380

133

13分48秒

133.尚硅谷_Flink项目-电商用户行为分析_双流实时对账（一）_需求分析和整体架构

350

134

22分23秒

134.尚硅谷_Flink项目-电商用户行为分析_双流实时对账（二）_合流代码实现

380

135

12分55秒

135.尚硅谷_Flink项目-电商用户行为分析_Join API（一）_Window Join

380

136

9分46秒

136.尚硅谷_Flink项目-电商用户行为分析_Join API（二）_Interval Join

240

137

9分21秒

137.尚硅谷_Flink项目-电商用户行为分析_双流实时对账（三）_Join代码实现

330

103.尚硅谷_Flink项目-电商用户行为分析_实时热门商品统计（三）_从Kafka消费数据测试

我来说两句

作者

相关推荐

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐