文章/答案/技术大牛

发布

首页视频024 - 日志数据采集分流 - 精确一次消费 - 后置提交加幂等方案

024 - 日志数据采集分流 - 精确一次消费 - 后置提交加幂等方案

2022-12-022022-12-02 16:02:22播放35

点赞0 收藏 0

3.尚硅谷大数据学科--项目实战/尚硅谷大数据Spark实时项目Spark Streaming/视频/024 - 日志数据采集分流 - 精确一次消费 - 后置提交加幂等方案.mp4

原链接：http://www.atguigu.com/

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:00
来吧，那我们继续往后说啊，呃，刚才呢，我们提出了这个第一种解决方案啊，就是事物的方案啊，但这种方案的话呢，呃，它有很多这个问题啊，也有很多这个限制啊，所以说呢，我们目前的话就不考虑采用这种方案了啊，那我们需要这个，呃，另辟蹊径对吧，我们寻找这个其他的这个解决策略啊。嗯，大家也可以去想一想啊，就是如果说把这个问题呢，诶甩给你了，说这个你需要把这个问题给他这个解决一下啊，那你能不能想出来这个更好的方案。对吧，啊行，我们一起来看看吧。呃，现在我们还有另外一种策略啊，什么策略呢，就是使用这个后置提交偏移量加上这个密等的一个处理方案。啊，这个看起来很抽象是吧，那我们一起来这个分析一下，呃，就是如果说啊，我现在告诉你，你在我们当前这个环节，如果你想做到这个精确一次的话呢，很难。
01:02
对吧，因为你如果说现在你就算做到精确一次，那大概率情况下，你就得采用把他们两个绑定到一起做成15的方案，嗯，但是呢，这个我们已经把它pass掉了，所以说我们就想啊，如果说我现在不追求这个精确一次，但是呢，我能够从整体的处理。流程中啊，最终去保证这个精确一次是不是也可以呀，就在你这个数据的计算之前啊，我把它保证了精确一次是不是也可以的呀。对吧？啊，那如果说你这样能行的话，那我们的这个方案就比较多了，你比如说啊，现在我们有这种方案。来，我把它打开。呃，我们这样去做看好了啊，就是我们一定要先保证。后置提交偏移量。就相当于啊，你现在两个问题，一个是这个重复提交重复消费啊，一个是漏消费，如果说我们现在只能让你去卡一头的话。
02:02
那我们是不是首先要保证？不丢数据啊，同学们。对吧，如果你数据丢了，那后面你就没得聊了。是不是你从前面的这个环节处理过程中，你就已经把数据丢了，你到了后面你就甭想着说有这个数据。对吧，所以说我们就可以什么先考虑什么，先考虑你的数据呢，不丢。对吧，我现在把数据给他留下来，留下来以后呢，在后续的处理过程中呢，我再考虑你这个重复的问题。对不对，好，那怎么就保证数据不丢了呢？那就一定是先写出数据，然后呢后提交偏移量。对吧，这样的话我是能够保证你的数据不丢失的。能听懂我的意思吧，好，所以说你看了啊，我们的所谓的后置提交偏移量，就是一定要保证你把数据写出去以后呢，我们再次呢去做偏移量提交，这样的话呢，哪怕你提交失败了，那顶多是导致我的数据的重发一次，重发一次的话呢，我再去做一次处理，那可能就什么导致了这个重复，但重复问题我们是可以再去解决的吗。
03:00
对吧，但如果说你的数据都已经丢了，那你就没得挽回了。对吧，所以这就所谓的什么后置调偏音量来，它的思想就是手动的后置去提交你的opposite，然后呢，先保证这个at什么list，就是所谓的什么至少一次，对吧，我至少得先把数据呢，消费过一次，能够成功的写入到我的这个下一层，然后呢再把这个偏移那做一个提交。好，那么在这种方案中啊，我们就留下了一个什么隐患，什么隐患呢，就是一个重复的问题，好，那这个重复问题我们就什么在后续的处理过程中，我们看看能不能做一个幂等处理。啥叫幂等处理呢？就是你有相同的两条数据。对吧，那你最终在处理之前能不能把它解决成一条。如果说你在这个数据的计算之前，你能够把数据给它解决成一条了，那你看一下啊，我们再加上你前面，诶，我保证你的数据不丢，最后呢，又保证你这个数据不重复，那么它们两个加起来不就做到了我们的精确一次了吗？
04:02
对不对。好，那现在我们的问题就是你在下游能不能做到这个事情呢？诶我告诉大家我们是可以的。嗯，因为我们最终的数据呢，是要写入到我们的这个ES，对吧？啊，之前也提到过，那么ES呢，其实是支持一个幂等写入的，就说白了你的两条相同的数据，如果你要在ES中，你采用的是幂等写入，那么最后呢，它只会给你保留一条。听懂我的意思了吧，啊，这样我们就可以保证你的精确一次啊，这就是我们目前诶比较靠谱的一种方案。啊，那么这种方案如果你呃提出来以后，接下来我们要想的就是这个落地的实现哈，那我们看一下现在这个落地实现的话呢，我们有哪些这个问题需要解决，首先第一个就是你的后置提交，那怎么后置提交呢？你就一定要保证偏移量是在我写出数据以后提交的，那我问大家你还能让卡夫卡自动去提交这个偏移量吗？不行了吧，如果你是自动提交，你是没法保证它的偏移量提交，每次都在我写出数据之后的。
05:04
对不对，他的自动提交我们昨天也说过啊，在这个位置我还单独给你提了一下，来找到我们这个卡不卡的工具类，在这个位置，如果你是自动提交的情况下，那我们会有一个自动提交的时间间隔。对吧，它是按照你的这个时间间隔来进行提交的，比如说每隔五秒钟我提交一次，每隔五秒钟提交一次，那你就敢保证你的每次五秒钟就一定是在我写出数据之后吗？不一定吧，万一刚刚我把数据诶从你的卡夫卡拿出来了，我还没有写出去呢，那你的五秒钟到了，那我就要去提交，这个时候他就又会跑到前面了。所以说我们就不能再进行什么自动提交了，我们就必须得手动的去控制这个偏移量的提交。理解了吧，啊，所以说呢，这个后置提交偏移量，哎，里面的一个点就是你要手动控制好吧，手动的控制啊，OK行，那如果说我们要手动控制这个提交偏移量的话。怎么去控制呢？
06:01
对吧，这个难点在哪呢？怎么去控制啊。啊，同学们怎么控制？那你就要明白一下卡夫卡对偏移量管理的一个方案。对吧，卡不卡最偏移量管理的方案啊，来这个时我们要去分析的啊，首先我来分析一下，呃，目前我们使用的这个卡不卡呢，是我现在用的是2.4的这个版本啊，但是大家可能讲的时候，你们讲的应该是3.0的对不对。啊，这个虽然说这个3.0中有很多这个新的特性啊，但是呃，其实目前我们并没有用上哈，所以说我们这个还是基于这个2.4的来去讲解也是可以的。能理解吧，好，呃，这个卡夫卡在这个零点零点几0.9吧，应该是我记得。啊，这个应该是一个分水岭啊，0.9之前它的这个偏移量呢，应该是维护到那个。就是主K里面的。对吧，然后之后的话，它就是我们维护到了这个卡不卡的本地，这个大家都是知道的吧，维护到卡布本地，然后呢，呃，通过卡不卡中的一个内置的一个topic，然后呢，进行这个偏量的一个管管理。
07:07
这个topic大家应该都还有印象啊，我可以带着你简单去瞅一眼，来，来到OBT魔掉卡不卡下面，呃，我们就来到这个Z4里面吧，这里面你就会看得到啊，就这个玩意。对吧，啊，当然我们现在看到的是它的这个分区啊，就是这个就是那个topic的名字，它总共有50个区啊，对吧，现在你应该看到的是其中的1/3吧，因为我们是分了这个三个节点嘛，234里面是不是都有啊。对吧，他为什么平均的这个分到这个三个，呃，Block里面。对吧，目前是维护到这个里面的。好，这是你要知道的一个点啊，然后再一个点就是。我们怎么去手动提交。对吧，我们怎么去手动提交，这个是比较难的一个点，现在为啥呢。因为现在我们从卡不卡消费数据呢，其实并不是我们自己去做的，而是什么呀。
08:04
同学们，而是什么呀？而是Spark streaming在去做这个事。对吧。他再去做消费的这个事情，那就说白了，我们手里面其实是没有消费者的。这个都是由Spark stream帮我们做了封装的。如果说我们手里面是有消费者的，那我是可以通过你的消费者对象去调用你的什么commit，然后呢去做什么做这个opposite提交的，但现在问题是我们手里面没有这个消费者，那你就没有办法去做考密的这个事儿，你就控制不了这个事情，你就没法在你代码中去控制它。对不对。这是一个难点。好，那么大家想想哈，既然你会遇到这个问题，那你说人家这个Spark streaming再去封装这个过程的时候，他能不能想到这个问题呢？他一定是能够想到这个问题的，所以说他就会给你提供。手动提交偏移量的。方式对吧，或者什么手动提交偏移量的这个，呃，这个这个代码。
09:03
OK，那我们来看一下它怎么提供的啊在这。听完了在这。就是当我们从你的卡不卡中啊，基于这个Spark streaming消费出来数据以后呢，我们拿到的是这种结构。对吧，这种结构我们昨天都看到了，大家应该还记得吧，你看一下啊，就是我们从你的卡不卡中消费出来数据以后呢，我们拿到的是这种结构。能听懂吧，行，那你拿到这种结构以后，注意我们是可以通过如下的代码进行这个opposite提交的，就是你把你的这个stream，然后呢转成一个。什么呀？就是可以提交opposite的一个类型。然后呢，再去做一个提交。能不理解，这样我们就可以什么手动的去控制了。明白吧，就人家也帮你提供方案了，但是这种方案我们能不能用呢？
10:01
我们现在还用不了。为什么呢？因为他有一个要求啊，什么要求呢，就是如果你想去提交这个opposite，那么你的这个流啊，你必须是这个类型的。能听明白，同学们好，那我们来分析一下啊，我们整个的代码听好了啊，我们整个的代码来还是看这个。看这个流程啊，我还是把它截个图吧，要不这个翻来翻去的啊。把它定个图顶过来啊，我们整个这个代码的处理过程是这样子的，你看了啊，还是回到这儿。我们把数据呢，从你的卡发卡中消费出来以后，就是我刚刚消费出来以后，我敢保证我肯定是这个类型的，这个没毛病吧，同学们好，但是我们什么时候提交offet呢？我们是在你的数据都写入到卡不卡中以后，我再去做提交的，好那么你在这个环节中，你还敢保证你的流是这个类型吗？是这个格式吗？
11:00
对吧，你不敢保证了，为什么呢？因为我们的代码中，我拿到你的数据以后，我首先做的就是你的结构的转换，然后接下来做了分流操作，那就说白了，在你提交这个之前，我们是对你的流呢做了结构转换的。那么。他这么说的。只有你的这种结构的流才能够去做这个操作，如果说你做了结构转换了，对吧，你对它是进行了转换以后，它就没有办法再进行这种操作了，而我们目前的场景就是我确确实实对你的流呢做了结果转换的，那我把数据写到卡夫卡之后呢，我现在手里面那个流的格式呢，已经不能再去做这个事情了。听明白我的意思了吧，所以说虽然说人家这个Spark streaming呢，帮助我们提供了这种方案了，但是不好意思。你用不了。它也有限制，如果你想用，你就不能对你的流做结构的转换。但是呢，你不做流结结构的转换，你没法做我们后续的操作呀。
12:02
对吧，那我不能为了这个手动控制这个偏移量，我不做这些操作了吧。对吧，那你干脆整个实时处理，你就别做了。是吧，这个行不通。OK吧，所以说现在啊，摆在我面前的就是手动提交偏移量，这个事儿我们应该怎么去解决，怎么去处理啊，你使用人家这个Spark streaming默认提供的方案已经行不通了，那你又得去想办法解决这个事。这就比较头疼了。OK吧，大家想想有没有什么方案可以解决这个问题？啊，这个事儿，呃，你们之前都没有遇到过啊，来，我们就一起来去说他啊，应该怎么解决，行，我们需要这么解决，就是我们需要自己完成一套偏移量的管理方案，能听得吧，我们需要自己完成一套这个方案来去做。好，我来给大家去分析一下这个过程啊，现在我们的问题是这样子的，就是你从卡夫卡中消费出来数据以后，就是我刚消费出来的这个结构，我是可以去提交偏移量的，那么如果说你能够提交偏移量的话，那我是不是可以认为你在你的这一波结构中，我其实是有偏移量信息的？
13:18
能不能理解？要么你说你提交，你提交的话，你不得有偏移量吗？你没有偏移量你怎么提交啊，那么既然你能够提交，那我就可以认为你的这个结构中，就你当前这个stream中，你是有偏移量的信息的。对吧，只不过呢，诶我后续做了转换以后，你比如说你转成别的结构了，那我再去提交的时候呢，这个时候我这种结构里面是没有偏移量信息的，所以说你提交不了。对吧，那我能不能够做到。我在我最终提交的时候，我手里面有偏移量的信息，那我再去提交不就OK了吗。对吧，所以说现在我们就有这种方案啊，什么方案呢，我们不用你Spark streaming的这种方案，对吧，我不用你的这个模式来去提交了，因为你的限制太大了，那我怎么做呢？我消费出来数据以后呢，我在没有转换结构之前，我就先把这个偏移量信息呢，给它想办法提取出来。
14:13
我转到我的手里面。能明白我的意思吧，我转到我的手里面好，当然你不能说这个转到手里面，你要把它维护起来，对吧，你把它存储到某个位置好，那我存储起来了，接下来呢，你就放心大胆的去做你后续的操作，你该转换转换，该处理处理，那么最终我把数据写入到我的卡不卡中以后，好，接下来我把我之前存下来这个offset，我再去做一个提交，这样不就OK了吗？对吧，我再次去做一个提交，这样不就OK了吗。能明白我的意思吧，就是我先保证我手里面有这个东西，我才能去提交，如果说我手里面都没有这个东西，我就没法去提交。好。那现在这里面还有一个问题，就是你把这个偏移量转到手里面的，你最后提交的时候，你怎么提交呢？你是不是还得有消费者对象才可以啊。
15:06
但关键是我没有啊。对吧，所以你到了这个环节以后呢，你没有办法跟你的卡不卡去做联通啊，说来卡不卡我给你提交ET，他说对不起，我不认识你。对吧，因为你手里面没有消费者对象，你就没法做这个事儿。因此呢，我们就不能把这个偏移量啊，再往卡不卡提交了。我们需要自己去维护了。对吧，就相当于我们自己完成了一套这个偏移量的管理方案，我把偏移量呢，从你的这个流中呢，把它提取出来，提取出来以后呢，比如说我就把它维护到某个组件中啊，假如说我维护到这个red中，对吧，或者说呢，维护到my circle啊，这个就看你怎么选对吧，当然别的也可以啊，行，我维护到这个组件中。对吧，或者说呢，我先维护到转到我的手里面啊，转到我的手里面，然后呢，等我把数据呢，都处理完成以后呢，我再把这个偏移量呢，就是维护到你的这个red中，或者是维护到的ma so中。
16:00
对吧，就相当于我单独去把你的偏移量的做了一个记录啊，就是我自己知道我目前消费到了什么地方了，那我下一次我在进行消费的时候，我就从我的red中呢，把我上一次维护的偏移量拿出来，我告诉卡不卡我要从这个偏移量开始消费。这样不也行吗？对吧。好来，那我们整体把这个流程给大家去说一下啊，我们正常的环节是卡夫卡中，他帮我维护了便宜呢，比如说诶目前是100，好，那我每一次去消费数据的时候呢，卡夫卡会先会去看一下你的偏移量是100 OK，那你就从100的位置消费，比如说我消费了100条数据，那我消费到200。这个卡卡会帮你维护起来，你下一次消费呢，他会看一下你现在在200的位置，OK，那我就从200的位置开始给你消费。对吧，但是现在这种方案的话，我们行不通了。能明白，因为我们需要手动的去控制，那我们行不通了，那我就这样去做，我可不可以考虑把这个100呢，我自己去维护起来，对吧？那我每次到你卡不卡消费的时候，反正他说了你得给我一个便宜量，我才知道从哪个位置帮你去拿数据，那我就把100给他传过去，说来你从100的位置中帮我拿数据，那我拿出来一波数据以后呢，诶，我一看我拿到了200的位置了，OK，那我就把200呢，我也记录下来。
17:17
对吧，那我下一次我再次去做消费的时候呢，我把200给他带过去，说来你从200的位置开始给我消费。反正对于卡夫卡来讲，他不管这个偏移量到底在哪里，他只管你把这个东西告诉我就行了，我就能够帮助你去做消费了。听明白了吧，就是他只要知道偏移量，就是你告诉他偏移量了，那么他就能够从偏移量的位置呢开始帮你去拿数据，而他是不管这个偏移量到底是哪里的，是你给他的，还是他自己拿回来的，这个他不管。理解吧，啊，这个举一个简单的例子，就是比如说你有一把锁对吧。你有一把锁，那么这把锁你要开的话，你得有个钥匙，能明白吧？哎，你得有个钥匙，好，那我问你啊，这把锁他管不管这个钥匙是原装的钥匙，还是你后来配的钥匙他不管，只要你的这把锁能，只要你的这把钥匙能够打开我这把锁，诶，那就OK了。
18:15
对吧，至于是原装的钥匙，还是说你后来配的钥匙，他不管。对吧，那同理放到这个句话，就是他去做消费的时候呢，他其实是不管那个opposite到底是他自己维护的，还是说你给他传过去的。只要这个是合理的，OK，他就能够帮助我去做消费。能听明白我的意思吧，所以说啊，我们在这个实时的处理过程中，我们一般去解决这个。精确一次，我们都是采用后置提交偏移量加最后的密等处理，这个密等处理我们先不聊，我告诉你后面我一定能够实现，现在我们只要先保证后置提交就行了，那么后置提交的关键点就是你要手动提交，那如果你要手动提交的关键点就在于怎么去维护opposite。
19:01
对吧？啊，那我们用的是自己的一套管理方案。明白了吧，就实际生产环境中，我们通常会使用，比如说诶主keep呀，什么RA呀，什么MYSO呀等工具，然后呢，对这个偏移量呢，进行这个保存。就是我手动的去维护他了。好吧，那么这就是我们的，诶最后的一个解决方案，就说白了，目前我们其实还不能做到精确一次，我只能先做到一半，就先保证数据不丢了，能明白吧，先保证数据不丢了，然后呢，最后呢，再去保证数据不重复，前后加起来我做到精确一次，这是我们的方案。好吧，大家把这个自己去琢磨琢磨啊，你把这个思想琢磨通了以后，那么接下来就是我们具体的实现过程。好吧，来，我先停一下。

展开

我来说两句

0 条评论

登录后参与评论

作者

腾讯云开发者课程

【合辑】尚硅谷大数据Spark实时项目Spark Streaming

（24/155）

6分42秒

001 - 简介 - 项目介绍

500

9分18秒

002 - 简介 - 离线计算

340

25分51秒

003 - 简介 - 实时计算

450

11分47秒

004 - 简介 - 离线架构

400

18分16秒

005 - 简介 - 实时架构

430

6分3秒

006 - 简介 - 项目需求

390

5分9秒

007 - 日志数据采集分流 - 整体架构

460

10分4秒

008 - 日志数据采集分流 - 采集到数据

430

10分59秒

009 - 日志数据采集分流 - 生成数据脚本

430

13分21秒

010 - 日志数据采集分流 - Kafka脚本

430

9分21秒

011 - 日志数据采集分流 - 准备工程环境

430

32分39秒

012 - 日志数据采集分流 - Kafka工具类 - 1

380

16分44秒

013 - 日志数据采集分流 - Kafka工具类 - 2

410

10分7秒

014 - 日志数据采集分流 - 配置工具类

390

25分44秒

015 - 日志数据采集分流 - 消费到数据

320

17分25秒

016 - 日志数据采集分流 - 分流 - 1

350

21分50秒

017 - 日志数据采集分流 - 分流 - 2

410

12分47秒

018 - 日志数据采集分流 - 分流 - 3

370

6分2秒

019 - 提gitee

330

20分34秒

020 - 回顾

330

21分53秒

021 - 日志数据采集分流 - 分流 - 完成

310

14分56秒

022 - 日志数据采集分流 - 精确一次消费 - 分析问题

360

11分57秒

023 - 日志数据采集分流 - 精确一次消费 - 事务方案

440

19分49秒

024 - 日志数据采集分流 - 精确一次消费 - 后置提交加幂等方案

350

14分22秒

025 - 日志数据采集分流 - 精确一次消费 - Redis工具类

300

16分25秒

026 - 日志数据采集分流 - 精确一次消费 - Offset工具类 - 1

400

17分47秒

027 - 日志数据采集分流 - 精确一次消费 - Offset工具类 - 2

330

9分24秒

028 - 日志数据采集分流 - 精确一次消费 - Offset工具类 - 3

440

20分4秒

029 - 日志数据采集分流 - 精确一次消费 - 完成

250

6分45秒

030 - 日志数据采集分流 - 精确一次消费 - 总结

330

13分21秒

031 - 日志数据采集分流 - Kafka缓冲区问题 - 分析问题

340

24分24秒

032 - 日志数据采集分流 - Kafka缓冲区问题 - 解决问题

350

15分11秒

033 - 业务数据采集分流 - 架构分析

430

10分21秒

034 - 业务数据采集分流 - MaxWell工作原理

310

16分28秒

035 - 业务数据采集分流 - binlog格式

470

9分28秒

036 - 业务数据采集分流 - 安装Maxwell和MySQL

440

14分50秒

037 - 业务数据采集分流 - 采集完成

460

23分3秒

038 - 回顾

370

19分48秒

039 - 业务数据采集分流 - 分流 - 消费到数据

370

25分38秒

040 - 业务数据采集分流 - 分流 - 事实数据

440

21分55秒

041 - 业务数据采集分流 - 分流 - 维度数据 - 1

390

9分0秒

042 - 业务数据采集分流 - 分流 - 维度数据 - 2

320

4分15秒

043 - 业务数据采集分流 - 分析问题

350

16分47秒

044 - 业务数据采集分流 - 解决问题 - 历史维度引导

450

9分31秒

045 - 业务数据采集分流 - 解决问题 - Redis连接

300

13分18秒

046 - 业务数据采集分流 - 解决问题 - 动态表清单 - 1

350

21分33秒

047 - 业务数据采集分流 - 解决问题 - 动态表清单 - 2

370

28分46秒

048 - 业务数据采集分流 - 数据处理顺序性

410

10分42秒

049 - ODS到DWD - 总结

450

15分2秒

050 - DWD到DWD - 分析(1)

410

15分2秒

050 - DWD到DWD - 分析

290

7分3秒

051 - 日活宽表 - 任务分析

320

13分28秒

052 - 日活宽表 - 消费到数据

340

15分42秒

053 - 日活宽表 - 去重 - 分析

410

11分42秒

054 - 日活宽表 - 去重 - 自我审查

410

18分57秒

055 - 回顾

360

21分38秒

056 - 日活宽表 - 去重 - 第三方审查 - 1

410

33分53秒

057 - 日活宽表 - 去重 - 第三方审查 - 2

320

10分19秒

058 - 日活宽表 - 维度关联 - 分析

400

23分4秒

059 - 日活宽表 - 维度关联 - 对象属性拷贝

370

7分3秒

060 - 日活宽表 - 维度关联 - 关联用户维度信息

350

15分20秒

061 - 日活宽表 - 维度关联 - 关联地区维度信息

330

6分26秒

062 - 日活宽表 - 维度关联 - 空指针异常问题

320

9分23秒

063 - 订单宽表 - 分析

370

25分43秒

064 - 订单宽表 - 消费到数据

330

18分8秒

065 - 订单宽表 - 维度关联

410

20分56秒

066 - 订单宽表 - 双流join - 内连接

350

13分53秒

067 - 订单宽表 - 双流join - 数据延迟问题

380

23分37秒

068 - 订单宽表 - 双流join - 数据延迟解决方案

550

22分4秒

069 - 回顾

400

17分54秒

070 - 订单宽表 - 双流join - 缓存方案 - 1

430

20分42秒

071 - 订单宽表 - 双流join - 缓存方案 - 2

420

10分31秒

072 - 订单宽表 - 双流join - 缓存方案 - 3

360

12分25秒

073 - ES - 简介

410

8分32秒

074 - ES - 使用场景

420

20分31秒

075 - ES - 常用存储框架比较

300

25分46秒

076 - ES - 特点

300

10分49秒

077 - ES - 安装 - 修改操作系统参数

450

19分36秒

078 - ES - 安装 - 安装启动

340

17分10秒

079 - ES - 安装 - 集群启停脚本

390

24分40秒

080 - ES - 安装 - 安装Kibana

360

12分22秒

081 - ES - DSL - 名词解释

430

17分39秒

082 - ES - DSL - 服务状态查询

280

28分34秒

083 - 回顾

390

18分10秒

084 - ES - DSL - ES存储的数据结构

400

23分56秒

085 - ES - DSL - 数据操作 - 1

260

25分47秒

086 - ES - DSL - 数据操作 - 2

450

11分13秒

087 - ES - DSL - 数据操作 - 3

390

15分27秒

088 - ES - DSL - 数据操作 - 4

340

14分12秒

089 - ES - DSL - 数据操作 - 5

390

12分49秒

090 - ES - DSL - 数据操作 - 6

360

15分47秒

091 - ES - DSL - 数据操作 - 7

430

13分14秒

092 - ES - DSL - 数据操作 - 8

380

10分10秒

093 - ES - DSL - SQL的使用

320

19分13秒

094 - ES - DSL - 中文分词 - 1

340

8分7秒

095 - ES - DSL - 中文分词 - 2

380

11分14秒

096 - ES - DSL - 索引分割

410

25分4秒

097 - ES - DSL - 索引别名

460

16分43秒

098 - ES - DSL - 索引模板

380

100

29分21秒

099 - 回顾

390

101

11分49秒

100 - ES - 读写原理 - 写流程

310

102

4分53秒

101 - ES - 读写原理 - 读流程

390

103

8分57秒

102 - ES - 读写原理 - 搜索流程

450

104

11分54秒

103 - ES - 读写原理 - 并发写控制

420

105

19分14秒

104 - ES - Shard与段 - Shard数量

320

106

29分8秒

105 - ES - Shard与段 - 段合并

310

107

16分10秒

106 - ES - 客户端 - 准备环境

340

108

13分29秒

107 - ES - 客户端 - 单条写入

340

109

10分7秒

108 - ES - 客户端 - 批量写入

350

110

27分9秒

109 - ES - 客户端 - 修改

300

111

6分30秒

110 - ES - 客户端 - 基于id删除和查询

390

112

20分45秒

111 - ES - 客户端 - 条件查询

340

113

20分23秒

112 - ES - 客户端 - 聚合查询

350

114

14分54秒

113 - 日活宽表 - ES工具类

340

115

16分41秒

114 - 日活宽表 - 写入ES

370

116

3分23秒

115 - 日活宽表 - 作业

360

117

23分10秒

116 - 回顾

330

118

13分46秒

117 - 订单宽表 - 写入ES

370

119

8分41秒

118 - 日活宽表 - 状态问题

390

120

12分26秒

119 - 日活宽表 - 状态还原 - 1

300

121

22分37秒

120 - 日活宽表 - 状态还原 - 2

370

122

6分8秒

121 - DWD到DWS - 总结

400

123

6分35秒

122 - 应用层 - 简介

360

124

10分8秒

123 - 应用层 - Kibana - 配置渠道日活

460

125

12分16秒

124 - 应用层 - Kibana - 配置热力地图

470

126

8分6秒

125 - 应用层 - Kibana - 配置大盘

500

127

15分53秒

126 - 应用层 - SpringBoot - web服务介绍

370

128

22分10秒

127 - 应用层 - SpringBoot - 技术发展过程

370

129

6分13秒

128 - 应用层 - SpringBoot - 简介

390

130

9分58秒

129 - 应用层 - SpringBoot - 初始搭建

350

131

12分6秒

130 - 应用层 - SpringBoot - 开发分层

440

132

11分40秒

131 - 应用层 - SpringBoot - 请求打通

430

133

9分37秒

132 - 应用层 - SpringBoot - 请求参数 - 1

320

134

10分54秒

133 - 应用层 - SpringBoot - 请求参数 - 2

300

135

10分29秒

134 - 应用层 - SpringBoot - 请求参数 - 3

370

136

16分16秒

135 - 应用层 - SpringBoot - 请求参数 - 4

300

137

17分8秒

136 - 回顾

330

138

7分14秒

137 - 应用层 - SpringBoot - 请求方式

330

139

12分16秒

138 - 应用层 - SpringBoot - 状态码

380

140

30分32秒

139 - 应用层 - SpringBoot - 业务层

320

141

8分58秒

140 - 应用层 - SpringBoot - 数据层

330

142

10分14秒

141 - 应用层 - 日活实时监控接口 - 接口介绍

380

143

5分29秒

142 - 应用层 - 日活实时监控接口 - 搭建环境

410

144

14分46秒

143 - 应用层 - 日活实时监控接口 - 测试连通

370

145

15分29秒

144 - 应用层 - 日活实时监控接口 - 查询总数

400

146

13分44秒

145 - 应用层 - 日活实时监控接口 - 查询分时明细

320

147

5分22秒

146 - 应用层 - 日活实时监控接口 - 对接前端页面

400

148

15分16秒

147 - 应用层 - 灵活查询接口 - 测试连通

400

149

25分58秒

148 - 应用层 - 灵活查询接口 - 类别统计 - 1

380

150

11分44秒

149 - 应用层 - 灵活查询接口 - 类别统计 - 2

410

151

22分31秒

150 - 应用层 - 灵活查询接口 - 明细查询 - 1

370

152

8分10秒

151 - 应用层 - 灵活查询接口 - 明细查询 - 2

360

153

22分33秒

152 - 总结 - 1

350

154

13分37秒

153 - 总结 - 2

350

155

18分47秒

154 - 总结 - 3

400

024 - 日志数据采集分流 - 精确一次消费 - 后置提交加幂等方案

我来说两句

作者

相关推荐

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐