00:00
好之后就是我们的一个规划集群,好规划集群当中呢,其实就多了一个。ZK啊,跟上午跟其他的都没变吧,但是跟我们相对于之前来说都是那not的跟三个这note对吧,这个ZK,而且我们还昨天学的是吧,比较熟,而且也是刚装好的是没有问题的,对,这是配置K的一个集群,这个就不看了啊,其他那个可文档里边也有也有我们主要就是配一下咱们那个高可用那个自照自动。故障转移啊,它的一个相应的一个配置啊,同样的这块也是有,但是我们还是希望根据什么官网上来吧,官网上来上午是不是讲到这块对吧,看到这块了,这块就是具体的一些命令嘛,啊一些命令OK,那我们继续往下走啊,当然这是他相应的命令的一个解释是吧,一个解释好这是什么,自动故障转移了吧,自动故障转移好。
01:09
这是相应的一个介绍,介绍看一下,它里面要一个K吧,啊依赖于K的K集群,还有一个什么。ZKFC的一个进程是吧,要这两个东西,然后UK呢,它有一个监测它是否是健康状态的。还有一个什么。一个选择是吧,而且继续往下看啊,ZKFC里边ZKFC里边有一个什么。Healthy monitor监控每个他当前自己所要监控的那个能控到的一个健康状态的。
02:05
啊,有这个线程来做的,你看ZKFC是一个进程吧,啊,这是这个进程里面一个线程啊。然后还有一个session management跟的一个会话的一个什么管理者吧,啊管理者那当一个当本地的什么,那么弄的是健康状态,这已经是前提吧,你能选举为active,肯定是健康的吧。啊,你你不是健康的肯定选不上了啊,它就会维持一个与的一个绘画。维持一个绘画,如果当你是active的,就更进一步了吧,对吧,如果当你是active的,它就维持了一个什么特殊的一个锁。其实就是一个临时节点吧,啊,其实就是一个临时节点,特殊的锁啊,谁忘了这把锁其实就是谁是active呢?
03:00
啊,它是这样来控制,对外只能有一个S嘛,那没有锁的,它的状态,无论你是健康,你健康也没用,你也是stand,因为你手上没有这把锁啊,他就是看谁上谁手上有这把锁,谁就是IP。之后还有一个也是一个选择器,选择谁是,你看当无论谁当active,它healthy都是前提吧,啊,也是一个选择器,当然这个是如cable里边的,这个是ZKFC里边的。啊,这不能混淆了,因为ZKFC啊,刚才提过ZKFC,它这个名字特别容易理解成它是从K的一个进程,但是它不是,它是哈多的一个进程啊,哈多的进程好。那这块他让你要一个K啊,接下来具体的去配置吧。啊,具体的配置,他说配置什么,在哪个里边HDFS吧,好,然后配上一个这个HDFS。
04:11
这个配置信息其实就是。打开。自动故障转移的OT model ha,然后是。EDC哈杜cos对吧,ID是吧。Cos也要我们先放DS在这。OK。嗯,看到这吧,你看这是什么,你看这个是否开启自动故障转移吧,那你肯定要改为出吧,啊改为出开启了,好接下来往下。
05:00
还有个什么?里面添加这个内容,这个大家更熟悉,好赛来赶过来看一眼,这什么如K的集群呢?负器地址吧,哎,你要用哪个用哪个集群,那这就简单了吧,这个是什么?哈多哈102,然后这个是哈多103。然后这个是哈多宝104啊,你配上你自己的就行了,就你要用哪个VK集群来为你提供服务啊,提供服务好,接下来看还有没有什么配置。没了是吧,就已经没了,它下面就是命令了呀,啊,他说你一定要先去起它的一个UK的一个服务,那我们肯定知道,因为你要用黑,你肯定要先起组黑对吧,然后之后就是看。
06:01
初始化ha的一个standard in cable,哎,就是在ZK当中啊,初始化ha的一个所谓一个状态信息啊,通过这个命令。IDFSZKFC杠放的ZK吧,通过这个命令将你ha相应的一个信息啊,保存到你的ZK里边啊ZK里边,然后之后你看就直接让你大D了吧,就是启动了是吧,就启动了OK。那我们操作一下,首先是启动一下我们那个ZK集群是吧,AK集群这边刚才电脑合起来了,所以断开连接了是吧。你们ZK还是一个一个起的是吧,群起啊,一个一个起多麻烦。然后但是群起来了之后,你光看一眼。
07:00
这个东西在它不一定起来了嘛。啊,有同学遇到过这种情况吧,那三个进程都在,但是你要确保一下,你一定要看一下什么。你随便看一台,如果你能看到follow或者说leader的话,哎,你的集群才是可用的,你尽量就看一眼啊,就是你每做一步操作,你要保证什么。前面的已经没有问题了,因为到后面最终出现问题了之后,你好定位呀,对吧,好定位b ZK solo.sh吧。啊follow能看到这个说明你的VK集群肯定能正常工作啊,肯定是正常工作了,接下来现在我看一下,刚才我看到我们那个真动弄的,还有什么那个弄的都是开启状态是吧。那肯定是不靠谱的,如果你是开启窗台,你一定要先把它关一下,关一下好。MODEL1定要到ha下面去关网。
08:03
到这我直接stop dfs.H。看两个那弄都会关闭了,常弄的这弄的在这个脚本里边应该也是会关闭的,而且你配了那个自动故障转移的话,它还会关ZKFC。你看对吧啊,因为你配了自动故障转移啊,它就会尝试的去,它就会读到啊这个ZKFC这个进程。啊,之前我们关键时候是不是真的note跟这个都没有见过呀,对吧?啊,你用这个脚本的时候都没有见过的,因为你那个时候是没有配针两个东西的啊,真正动的是我们上午手动的时候加的吧,ZKFC是我们配的自动故障转移改为触了之后它才有的吧,他才有的好这个时候要干个什么呀,再写一下,一定要先格式化,你不格式化没有用呢,初始化它的一个在K当中的一个。
09:15
Ha的一个状态啊啊,就告诉HK,哎,你要帮我工作了,好吧,我工作了,具体的这边也一样啊,首先要关关启动,如K化啊,之后要格式化,格式化那我们就从官网上粘一下是吧,B这个CTRC反过来。啊,站在这儿走一下。这边就已经完成了,完成之后我们可以看一下zoo people当应该会多一些内容是吧,他们说在people当中初始化它的一个状态嘛,Ha的一个状态嘛,对吧,CD到OBD model如K里边,然后b ZK clean,对吧?哎,点SSH。
10:04
LS跟,哎,确实。多了一个节点,哈杜ha这个节点,那我们LS跟哈杜ha它有一个myster,是不是我们那个集群啊,哎,因为你的zoo keepper不仅能管理,你不能说zoo keep只能管理一个。哈,多个集群吧,你公司当中哈多个集群不止一个的知道吧,它可以根据业务线来的,就是你不同的业务线,或者说不同的部门,他都有可能有自己的,他都有集群,当然这是偏大型一点的公司啊,那小公司他服务器就那么多是吧,他肯定集群肯定少一点,也就是说咱们同一套组K。可以维护多个不同的。哈多集群,当然你哈多果集群对外的名称你不能一样了吧?啊,咱们这个是麦克class斯,跟官网上的一样,没有动,你要是再配其他的,你可以叫麦克CLASS1,麦CLASS2,或者说你这个集群的名称,如果是根据业务线走的话,那你集群的名称是不是就是业务线的名称啊,啊,肯定是这样来起名字的,好接下来我们看一下这个麦克拉斯里边,哎,具体还有没有什么其他的节点。
11:18
空了对吧,还空了,因为我们并没有起任何的其他的进程,只是它这个初始化呀,我们就知道了它初始化的一些什么内容啊,其实就在ZK当中创建了这些关于ha相应的一个节点啊,创建了ha相应的节点。啊,然后接下来他说直接去起大的就了,病一定要病吗?D点这时候执行的时候,我们就知道什么也好也好,这也好,还有什么ZKFC也好,都能一并起来了,因为我们关闭都能关闭啊,那企业肯定也都能起来了啊。
12:08
你看ZKFC,你只要配那个,它只会在102103去起吗。因为ZKFC的功能主要的就是一个监控它的一个健康状态,第二个就是切换它active跟STEM的拜访,那你切到的104你都没有,那no的就没有意义了啊,所以它是会根据我们并没有配,没有任何一个地方配102103嘛,你只要配了那个属性为触,它就会在那no所在的节点,哎,去起这个ZKFCKFCOK。有问题了,这个不见了是吧,103的正常的103应该有一个是吧,OK,我们去看一下,正好看一下调下错是吧。Ha,然后是哈杜进到拉斯里边。ZKFC的一个logo,哎,看他到底出了什么问题,看了一下好不?
13:08
这么点内容吗?两个衣服。他说自动故障转移。啊,我知道哪错了,大家看这个问题才有能不能感觉到哪错了,他说不能对,没有分发啊,没有分发,所以说在103的时候,他还是false还是false。所以说你看到这块一定要敏感啊,那我们把机群关掉是吧,关掉之后分发一下,分发一下。就是要不然你看你光看这个东西不见了,你上哪找去啊,所以一定要看日志,看日志,然后他说。自动故障转移是不被允许的,那你明明都开了还不被允许,那说明一个问题,就是刚才确实我们没有分发是吧,没有分发,那分发一下XXYC。
14:08
然后。完了,我刚才是这个是吧,我就说为什么有三那么多的啊,没有这个进程,那就对着呢,没有对的。Sb stop啊DFS重新关一下就OK了是吧,你一看我一看到这个second,我就知道你用的是之前的那个机群,之前那个机群。重新关下。关下之后我们分发一下,分发一下就OK了。好,然后XXYC,然后是ETC哈度,我们整个的这个文件夹都发一下OK吧。好,然后再起下叫病是吧,大。
15:09
这个SK啊,确实是比较容易丢的,因为大家包括我也一样,平时都敲习惯了start的杠DFS是吧。其实你这些美女到公司当中哪敲哪哪哪能天天敲呢,对吧,你集群一天起一次还得了,集群都不关了,不可能关了吧,有了。现在正常了吧,哎,这个也有了,这个也有了,那NOTE2个有了吧,然后如man是什么。开帮卖是什么,是这个吧,他客户端啊,客户端也是一个进程吗?啊开帮卖,然后对的not的真的弄的看一下三个是不是都有呀,还正常了,OK,我们来看一下那个了。
16:00
这是幺三是算一下还有吧,还正常的,都是先起的,你看一下这个日志顺序。102先起那not的后起的103是吧,就是正常的,没有什么通信阻塞啊,那时候一般都是先起的啊,都会是的啊,都会是好,然后这个103不用想,肯定是stand吧stand。那我们测一下吧。这是102上的,就是现在是的那么弄的跳掉,然后这个是985,你现在截边看一眼没有那么弄了,对吧?OK,那你网页访问这个肯定是没有用的。他肯定防到了,因为技能关了,然后我们主要看一下这个有没有切换成吗。
17:01
哎,它就自动能切换过来,那这个时候我们把这个启一下呢。好多点sh start name no,那此时103是是active的,对吧?啊,他就握着那把锁,是不是握着那个临时绘画节点,而且103也没有挂,他这个锁是不会丢失的吧?那note有了吧?啊,有了,但是你看一下,你现在看一下这个102肯定能访问了,但是它是stand。那我们现在把103他是I啊,把他干掉呢,然后这边看一眼,103是6923,然后跳杠九,然后6923,现在103那个能弄没了吧,主要这个就不不看了吧,103肯定访问不了吗,主要看看这个。
18:02
102变成active了吧,变成了这是没有问题的。
我来说两句