00:00
好,那测试的话呢,我们首先要开一个NC-LK8888第一个啊,然后呢,这边我们同样的NC-LK99992个端口号得开一下才可以对吧?好,这边未来输入的数据呢,比方说是1001逗号姓名张三对吧,然后逗号,然后呢,给一个时间啊,假如说。呃,给一个一吧,啊一秒对吧,这边呢,比方说也是1001啊,那给一个mail,我先没有敲回车啊,并没有敲回车,那我也先给一个一可以吧,两个先一样让他们专心上啊,来运行一下。我们还是一样的,多等一会儿,然后呢,去输我们的一个代码。
01:16
好,这个时候已经启动了,对吧,那接下来呢,我先把这个。8888端口回车写进去对吧,那大家说这个时候会有东西打印吗。他不会对吧,因为只有来了一边数据嘛,我们是要关联上才有数据输出对吧,所以这个时候只有左边数据来了,哎,那他不会输出,好,那接下来呢,是右边数据来了。输出了看见没,对吧,打印了一条数据,并一并二,因为我写的是一个top嘛,写的是一个top,偷偷工减料一点对吧,没有没有把他俩诶写成一个招并,假如你来个并三,把他俩合并一下也可以啊,自己去做一下啊,然我没做了,直接他对吧?好,那这个时候假如说在这边啊,1001还有一条数据又来了一个female,然后呢,它的时间是二,那大家想一下,我把这个数据输进去,它这边会是什么现象。
02:11
有没有数据打印?大家觉得?有没有数据打印?我把这个输进去。这个控制台会不会有数据打印?好,那我们看一下。啊,大家都是一或者有对吧,来我们看一下输进来啊,这边数据是不是打印了对吧,因为硫跟硫的join啊,肯定是要考虑这个多对多的关系。对吧,考虑多对多的关系好,这个没有问题,呃,那比方说这个时候啊,我做一个事情来做什么事呢?来看啊,假如说我这边又来了一个1002。
03:02
1002呢,是李四可以吧,然后呢,他是这个。十啊,它是十对吧,直接跳跃到这个十了,好,那我把这个先输进去,当然这个输进去这边也不会有什么打印,对吧,因为它是1001,也不是1001,那这个时候呢,我再做一个事情,做什么事呢,我输他。我再说一个三啊,这个三呢,我改一下,我再改成ma对吧,输一个三。呃,大家想一下啊,我注意啊,这边我已经输进去了,这边我已经输进去了,那这个。我再输这一条,它还会不会有数据打印?
04:08
有没有大家都认为没有对吧?啊,那大家都是二啊来我们输进去,我们来看一下。完了。你看大家呢,全军覆没了。全军覆没了啊,想一想为什么?对吧,好,那这个时候呢,我再来一条数据啊1002。102,然后呢,这个非,然后呢,它也是十。啊,它也是十好,那来看啊,1002这个数据也就输出了,对吧,1002输出了啊106这个肯定得输出对吧,那这个时候我再来一个。101。
05:01
没有,然后谁呢这个。11。11对吧,那之前呢,这个数据一在这,哎,跟我这个三能关联上,我都输十了对吧,这个还能关联上吗?关联不上了啊,我这一通操作大家想一想为什么。好,那这样呢。我再输一个三呢。有同学说失电时间。那这个呢,三呢,现在还会出来吗。11有同学说时间对吧,我再输一个三。
06:03
三呢,不在这个范围内吗?1001对吧?K能对应上吗?1001好,然后呢,这个是三,这个是一,在时间范围内啊。哎,完了,哎,我干嘛在这边敲了一个回车,我刚才在这敲了个回车。我刚才在这,我重新重新来一下这个。好气呀。我应该过滤一下这个脏数据就好,对吧。好,那我们重新再把这个启动一下,我刚才敲了回头,我没有过滤脏数据,所以它直接就报错了,因为是一个空嘛,空的话数度小白预界了对吧?好,那我重新启动啊。呃,把我们刚才的现象再演示一下,首先呢,在左边我输了一个1001张三。然后一对吧,好,然后在右边这个呢回车啊,这个不会有打印,然后在右边1001,我输了一个mail对吧,然后也是一好,这个呢会有数据打印,这是第一条数据,没有问题,呃,然后紧跟着我在这边输了一个1001,然后呢female,然后给了一个二好,这条数据呢,也会打印,因为多对多的关系,对吧,它也会打印,这个没有问题,好,当我在这边我输了一个1002,然后呢是李四,然后它后面呢是十对吧,啊输进来它并不会有打印第一条数据,1002踢败了,所以它不会把1002跟1001关联起来,这个没有问题,因为踢败了对吧?好,那接下来呢,在这边我又说了一个1001,关键是ma。
07:41
三大家记得这条数据是怎么样?可以打印出来的,对吧,可以打印出来的,好,接下来呢,我又输了一个1002,然后呢,然后这个地方是十。对吧,这条数据也出来了,没有问题,呃,那接下来的问题是我刚才输了一个11 11我就不说了,大家都知道问题对吧,我在这边输一个1001非,然后呢,再给一个三。
08:08
再给一个三对吧,因为我给的是负五到五啊,负五到五,那这个一跟三注意啊,刚才有同学说那个十是超过时间了,对吧,那这个一跟这个三也没有超过时间好。来回车。这个就没有打印。这个就没有打印了。注意哦。为什么?那这个十注意啊,这个十。是在这输的啊,也就是在这个三之前输的。我刚才这个地方输的十是在这个位置输的,在这条线这。输的。对吧,那为什么这个这两个三一个打印了一个没打印。
09:08
好,World马已经到十了,然后我马的短板,短板效应没问题啊,其实就来自于world马,你注意看啊,我们现在呢是两个流。我一个流里面发吧。也就是说前面是两个边因度,后面是一个边度,跟我们之前所说的多边路是一个道理,好,那第一次我B这是一对吧。这是不一对吧,这呢也是一,所以呢,当前这个whatmark是一没有问题,好接下来呢。这个数据我把它变成了二,但我mark还是一,对吧?好,那又变成了十,把这边变成十,但我还是几啊,还是二,还是啊,那当第二个第二次第二个留这边十来了,把这个干掉十两个都是十,我B变成十了,我bug变成十了,你之前保留的这个一最多保留五秒,是不是按照事件时间保留五秒,是不是这个数据就被删掉了?好,那这个时候再来一个三,还能跟之前的一能关联上吗?就关联不上了,对不对?能明白这个点吗?
10:16
啊,注意看啊,现在你做咱们做双流双引就是两个并行度合并到一个并行度里边,哎,Worldmag呢,对于下游的worldmg取的是上游最小的worldmg,所以当只有一个流时来的时候,我MG还没有更新到十。没有根一到十,没有根一到十的时候,这个地方是不是还是按一保留五秒那个算的。能理解吗?Wordmark的一个传递问题。能理解吗?能理解对吧,好,那这边呢,我大家找一下,我看看我这边。
11:04
我这边应该有一个。嗯,啊,这个电脑上没有吗?我看一下。CDC啊,我我看一下link,然后资料这是数据是吧。哦,那这还真没有,应该在另外一个另外一个电脑里边,或者说我找一下这,呃,找一下林这。CP一致性window啊,没有没有,算了啊,我之前是做了一个PPT的。我看一下我这边有很多PPT啊,其实大家之前看到的很多PPT都是我做的,我看一下这个地方能不能给大家去找一个那个PPT啊。这个都是Spark那个。内核当中的,内核当中的未优化的呀,优化的呀,本地索引这些PPT呢,都是当时我做的复令PPT啊,那就是不在这个电脑啊,不在这个电脑那算了啊,到时候后面我们大家找到给大家看一下啊,其实就是那个wordmark的一个传递问题,对吧?啊,我刚才说的大家应该能够理解啊,就是说如果说有那个PPT呢,能更看更清楚一点,好,这是我们所看到的啊,这样的一个照应,大家下去可以自己做一些测试嘛,这个也不难,比较简单,对吧。
我来说两句