00:00
那大家自然想到了,在这个过程当中,我们的核心问题其实在于是,哎,就是这里边是不是提交这个job之后,发现需要用,需要占用的这个lo的数量,呃,比我们这个能够集群提供的资源还要大呀,对吧,这里边就导致我这里边这个分配资源一直分配不下来,对吧?让大家想一下,当前我们这个状态的话,可以怎么样让它运行起来呢?哎,对,呃,这里边其实有两种方式啊,既然是我当前的集群的资源太少,然后你这里边啊,需要的这个资源太多对吧?那我想要让它运行起来的话,两种方式,一种是不是调大集群的资源啊,这个就要求我要停掉集群,然后重新做一个配置,对吧?把我的那个配置配置项要重新改一下啊呃,那另外还有一种方式就是对我可以把当前执行这个这这个drop的并行度是不是可以调低啊,调低如果需要的这个资源少的话,是不是理论上也可以执行起来啊?诶,那这里面有一个问题,就是说我们当前的这个有四个任务。
01:08
这就涉及到一个问题,四个任务到底它需要几个?需要多少个资源才能运行起来呢?多少个才能跑起来呢?哎,有同学可能想到,那至少应该要四个对不对,我们当时说这个slot嘛,就是我们多线程的时候,每一个线程要占用一部分资源去独立运行嘛,啊,那你给他分配一个slot,这不是天经地义吗?所以一个任务分配一个slot,听起来很好理解对吧?那是不是四个任务就一定要四个lo跑起来呢?我们可以试一下啊。接下来我们把这个集群停一下,重新配一下啊啊,那大家知道这个停集群用的是哪个,对,直接stop cluster把它停掉。这个停止大家看也非常的快,对吧,一下就没了啊,然后接下来我们看一下当前的flink com的这个压没文件,接下来我把这调一下,我现在因为只有一个task manager,所以我调不了别的,对吧,我是不是只能调这个呀。
02:16
Task manager number of task slots,诶,那这里面其实有同学可能也会想到,就是呃,比较推荐给多大呢这个地方。其实比较推荐的就是给当前的task manager的CPU核心数对吧啊,至于说为什么后面我们给大家再再做解释啊,所以我现在就直接给一个四。那大家想,如果要是说它本身就是需要四个的话,那是不是现在就理论上来讲就应该够了,对吧。好,我把这个保存一下,然后接下来去启动当前的集群,重新启动一下。好,这边已经起起来了,对吧。
03:00
接下来了啊,然后接下来我们刷新一下这边的页面,刷新还是访问这个8081端口啊,这个显示应该有错误啊,还是零对吧?诶现在对了,大家看一个task manager总共有四个slot,然后available的有四个,那接下来我们再来做一个哦,当然这个我们要重新提交了啊。重新做一次提交,然后这里面还是ENT class写进去,这里边杠杠host local host,杠杠port 7777,然后诶,这里边大家看到这个parallelism,当时。刚才我们那个运行的时候,直接给的是几来着。直接就是默认并行度对吧,然后这里边收plan的时候,大家会看到里边有一个代码里面写死的二,这个必须要有对吧?啊,其他的两个都是一这个是没问题的啊,所以接下来我们就直接用这个默认命令度做一个提交submit。大家看现在执行起来之后啊,跟刚才还是一模一样的状态,但是下边是不是就不再转圈圈了。
04:06
这里面是不是直接就running变变绿色了,然后这里边变成零零币对吧,四个任务跑起来了。哎,那所以大家看一下我们现在占用了几个资源呢。大家看一下,还剩下有两个可用的slot,所以当前我这四个任务其实只占用了两个slot。哎,所以这这又是一个问题对吧?啊,大家看一下就是,呃,刚才我们给大家抢的这个过程当中,其实已经有一个问题了,首先就是为什么他俩可以合在一起呢?一开始我们并行图给三的时候,他俩没合对吧,现在为什么能合在一起呢?这是一个问题,然后另外还有一个就是这里边我总共是四个task,为什么这里边只用两个W就能跑起来呢?哎,所以这个都是我们值得去思考的问题啊,但是不管怎么说,我们现在至少是把它已经运行起来了,而且大家看我还收到了数据,为什么会收到数据呢?
05:06
哎,之前我这个NC发的这个hello flink是不是一直没有对应的端口接收到啊,那现在我才启动起来去监听,是不是现在就收到了这样数据啊,然后为什么这里边收到的数据是两条呢。因为Fla map出来是不是一条变两条啊,对吧,那这里边我还可以继续去发啊,比方说我再发一个how are you,我再来一个hello吧,Hello,呃,Word对吧。大家看一下。我们这里面正常来讲的话,诶,大家看它是不是变四了对吧,变四条数据了,因为我们这是两个词嘛,然后如果我们再来个how are you。How are you,我们再来看一下这里面收到的这个数据是几条啊?哎,其实大家能想到应该是几啊,看一眼。
06:00
诶,这个。诶,大家看变得稍微有点慢啊,这里边是七条对吧?诶所以这就是按照我们这个分配出来的,那这里边我们的输出结果呢,到哪去看呢?大家还记得之前我们那个print可以到标准控制台输出,对吧?呃,就是控制台的话就是那个标准输出嘛,S t out,那这里面有一个问题,Task manager和job manager都有那个标准输出,我们到哪去找呢?诶,其实大家想到了,是不是task manager是干活的人啊,干活的人这里是不是才有标准输出,就是才才会输出最后结果啊,哎,所以我们看一下大家看诶果然FLINK1 hello1后面是HELLO2WORD1对吧,然后how are you都是一,这是不是就有一个完整的输出啊,流式输出对吧?啊所以的,所以大家下来之后可以去测一下,就当前我们对于这个fli drop啊,它提交的这个过程当中,到底是怎么样去提交,然后他的这个资源到底是怎么样去分配的啊,这就是这样的一个过程。
我来说两句