00:00
好,那接下来呢,我们就要将其中某一个节点呢,改为我们的。Active,好,那web页面呢,我们刚才已经看到了三个stand对吧?呃,那么此时呢,为了最后能够用起来,所以我们在三个节点上分别启动我们的data node啊好,那我们把这个命令拿过来,拿过来好,以后呢,直接到102我去复制。运行103同理,复制运行,然后到这面来复制粘贴运行啊。好,那这样的话,我们就得到了最早的规划,对吧,X Co g bs啊呃,那总共呢,有这么九个进程,每台节点上都是一个node,一个name node和一个。Data note啊,这样的话我们集群就可以存储数据了,就可存储数据了,但是现在呢,你想存储数据并不可能,因为没有active的number no的客户端呢,根本不知道去连谁,所以这个时候不要着急,我直接到102上面将102的转化为。
01:07
哎,交。Transition to active,哎,把这个一改为我们的。Active的行,那到这上面来,我们走一下。呃,那它打印了一页日志,我们可以看一下web UI刷新,刚才还是stand,现在是I,诶这边呢,103我们可以刷新它是standby 104刷新它照样还是standby,这是手动指定这个内容啊。呃,那有同学可能在想,如果此时我们的102它挂掉了,102的name node它挂掉了怎么办呢?我比方说举个例子。K,把name no进程呢给它干掉对吧?好,GS,那此时呢,103104是有name no的进程,而102已经不复存在了,刚才我们看到GPS能看到这个现象,那么102呢,它肯定就访问不了了,对吧?那103104它大家思考一个问题,它会不会其中某一个节点自动的成为active呢?
02:18
那103我刷新了对吧,还是stand 104刷新一下,那还是standby啊,那比如说我现在想把NN3改为active,还能不能行呢?来NN3在这吧,加一个三走一下。好,那看一下他会怎么样报这个。102拒绝连接啊,102拒绝连接好,那是不是说在手动做测试的时候,需要我们每一个内都能够启动呢?对吧?大家也可以去思考一下,如果真的是这样,那为什么呢?是不是那我就启动一下。
03:04
的。啊,好,那我现在把102的note提起来。啊,把它启动,启动之后呢,我们JS看一下,然后这边我再重新将三改为active,但是在这个之前,我可以大家看一下102刷新它stand by,因为刚起来的,因为之前active没有用了,对吧,你挂掉了103STAND by 104stand by,此时呢,我想把104也就是第三个name note提升为active,还能不能行。哎,刚才不行报错了,现在呢又可以了,对不对,我们刷新一下。确实可以了,叫active。啊啊,那也就是说在我们当前手动模式下做高可用集群的时候,它需要我们所有的name node是启动状态,才能够将其中某一个节点转成active,那这样的话就失去了高可用的一个作用了,对吧?但是我们可以思考一下他为什么会有这种要求。
04:17
啊,大家可以思考一下,他为什么会有这样的要求。对不对,能不能思考的清楚。好,那我给大家进行一个揭秘,大家想我之前给大家提到了,在我们当前这个机型当中,我们是不是设置了一个隔离机制,同一时间只能允许有一个active的name node对外服务?好,那么现在呢,我们是不是已经配置了三台name node?比方说我要把第一台N1 N2 N3,我要把当前第一台提升为active啊,它有一个要求就是能跟这两个进行通信,其实很简单,他要确保这两个人是活着,并且同二三两台节点都是三的,如果我联系不上,那有多人说联系不上,我认为三就挂掉了,那你肯定起来之后也是四半,那为什么在这种情况,在三挂掉的情下来说,它还不能够提升为active呢?很简单。
05:32
很简单这个问题,因为假如一跟三联系不上,你能确定三是挂掉了吗?那有没有可能是一三两台服务器之间,他们的通信有问题呢?对吧?呃,假如说第三台机器跟其他节点通信没有问题,只是跟第一台节点通信有问题,跟其他的电note通信都没有问题,且我们第三台机器此时是active的,如果你能够强行将第一台服务器提升为active,那此时是不是一个基金当中有两个active了,形成了我们之前所说的叫脑裂?
06:15
注意思考一下刚才我所说的问题,很重要很重要啊,因为在未来我们要去规划这个自动。故障转移的集群的时候,其实也需要考虑到这个点。啊,那我们凭什么能感知到?假如说通信没有连上,我怎么能清楚的知道?你是挂掉的,还是说你是active,还是说其他的各种状态呢,对吧,这个非常关键,大家有没有听懂,如果没有听懂,可以把这个对于这个问题呢,诶打音。写在这个评论区啊,到时候我看到了会给大家进行一个解答,好。好,这是我们做手动故障转移的active切换,对吧。
我来说两句