00:00
好在我们把这个环境准备好之后,就可以配置我们的信息了,那既然是一个HD Fi集群,所以我们的配置文件呢,主要有两个,第一个是Co set,第二个是hdfs set,那我们把这两个文件通过我们刚才所说的这个工具呢,做一个打开,好还是点到file,然后SFTP选择我们的服务器,嗯,选择102啊,然后呢,退回来,刚才我们已经点进来了,对吧?呃,这条基于社的上一层在HHA哈杜宝3.1.3etc目录底下有一个哈杜,这个里边呢,我们先把Co set打开,然后同时我们把HDFS打开,因为我们要修改的就是这么两个文件啊,Hdf set,好,呃,那么打开了,我可以把这个字体呢,稍微的去缩小一点,对吧?好,那在这个当中呢,我们可以把这些内容删掉,这是我之前配置的,以及压缩的方式啊等等,我们就不需要了啊。
01:00
把我们内容拿过来,包括以前配置的102作为note也不需要了,现在我们是一个高可用的机群,我们并不能指定任何一台节点作为那node,而是要规划一个整体的机器名称,大家应该能明白这个问题,对吧?好,那我们把这个文档当中内容拿过来,我们稍微的去看一下,好好把它拿过来,然后呢,我把这个。缩进一下啊。Table键,然后这两行我也缩进一下,这样的话就稍微能够美观一点,也解决一下强迫症,对吧?好,那在这个过程当中呢,我们首先看一下还是一样的指定nameno地址,那现在呢,Nameno的并不是某一台机器的地址了,跟我们之前配置不一样了,我们要配置一个集群,那另外我们配置一个临似的目录,呃,放到OBD Mo,哎,就是我们这个录像data,刚才我们已经把data删掉了,因为我们要重新生成我们的数据,这两个并不难理解,对吧?那关键的问题在于我们接下来关于这个my class应该如何去配置呢?对吧?那这个呢,在HDF杠三当中,好,那我把这个也拿过来,然后一点一点的给大家去做一个介绍,一个一个配置文件,我们看一下这里边东西呢,会涉及到的比较多,对吧,但是没关系啊好,这里边之前指定了一个tonn的一个地址是不是,但是我们现在说了。
02:31
我们现在高可用机群里边是不允许有托N存在的,所以呢,它我们就直接删掉就好了,然后把我们的配置信息直接拿过来,同样的解决一下强迫症啊呃,那我们拖到下面拖到这儿,然后呢,我们缩进一下。好呃,那我们看着这些内容呢,我们一个一个的去聊啊,这个我缩进两个吧。能够好看一点啊。我再来。
03:00
锁定一个好,那这样,呃,那么接下来呢,第一个。第一个指的是name no存储的地址,那这个跟之前其实一样,还是放在我们刚才所指定的目录里边,也就是说Dollar表示引用之前我们的变量,变量呢是它。我们可以定在桌面上给大家放在这儿,那也就是说我们name note它的工作目录就放在这个目录底下,再来一个name对吧?好放在这里边,然后接下来呢,是data node,呃,那data node呢,就跟刚才的knowledge里一样,在我们哎,这个啊,已经缩进了,好,那搞定。呃,那data node呢,也一样,在刚才目录底下我们放一个date对吧?所以呢,我们来把这个也缩进一下,好,第二个是data node的一个数据存储目录,那么第三个在高可用基金当中,我们是不是多了一个真node,所以我们同时给它加一个叫journal的一个配置信息啊,那接下来我们要看一下我们的集群服务了,以前我们配的是单个节点,那此时我们看一下我们此时有一个name service。
04:12
啊,配置一个完全分布式的一个集群,名称叫my class,而这个名字注意一下跟他要保持一致,我们的访问地址,未来我们就不需要指定连接哈,102或者103等等这些信息,我们只需要去连接叫my class的这个地址就好了啊呃,那这是我们叫麦克拉,这是整个集群,那这个集群当中它的一个内no到底包含哪些内容呢?那接下来这四个配置信息就会告诉我们啊,为我们揭晓谜底,好,那我把这个四个呢整体去缩进一下啊。好,那我们来看,首先第一个我们的集群里边包含三个name node,跟我们的规划保持一致,N1 N2 N3,那么接下来呢,在我们整个运营过程当中,我们需要把N1指定为哈多102 N2指定为哈多103 N3指定为哈杜104,那么此时这个地方我们取的名字大家注意一定要跟这块相对应的。
05:18
没有问题吧,也就是说指定我们机型当中有哪些两的节点啊,然后呢,是分别去指定我们能节点是谁啊,那么接下来呢,是整个。通信地址。刚才我们所看到的8020是它的内部通信机址RPC的一个通信地址,那接下来呢,是HTTP,也就是说它的一个web端口,我们将这个节点启动好以后,就可以通过外部页面查看我们整体的体系了啊呃,那么接下来呢,我们要配置的就是journalno的一个地址啊,那我们呢,在102 103 104上分别配置一个journalnoe,主要的作用大家是否还记得叫同步ids文件的是不是对吧?好,那接下来这个配置信息用来它是一个访问代理类,可以让我们,因为之前我们说过,呃,那我们配置了高可用集群,未来访问的时候我们也不知道哪一台节点是。
06:22
Active的,对于用户来说,我们并不知道每一台节点是active,那怎么办呢?我们不知道我要访问谁呢?现在有三个节点,那我们之前说了,在我们配置好高可用集群之后,我们其实访问的是my class,然后交给客户端的一个代理类来处理my class,将它能够转化为。连接到节点。这个相信大家也能明白,也就是说我现在有三个内node,我作为客户端来访问的时候,我并不知道谁是active,谁是standby,那我就没法连接某一台机器,那怎么办呢?我就直接指定地址为class,其中让此时这个代理类来帮我们找到,诶,我们的active是谁?那这样我们的客户端就可以成功的连接到active。
07:18
啊,这个并不难理解吧,好,最后两个内容是我们相当于这个隔离机制,我们只能允许同一时刻呢,让一个节点对外服务,啊,也就一个name no的节点,那如果说多个name no的同时对外服务,那大家想一下会不会有问题?可以思考一下。对吧,就相当于一个公司当中有两个老大在发号施令,那A说往东走,B说往西走,那你到底往哪走?啊,那这样的话其实就产生了。
08:00
Ha集群当中一个典型的啊,被称为现象叫。Split brain叫脑裂啊,脑裂啊,所以未来我们玩的时候呢,其实就是指的是脑裂啊,因为它有两个大脑了,此时因为我们说的那node呢,它是一个。主节点管理的整个机群,如果此时有两个人同时工作,那我就不知道听谁的了,所以最后配置隔离机制啊,最后呢,这个隔离机制上使用SSHSH,呃,密钥登录,那这个将是在自动故障转移的时候才会用到啊,到时候我们遇到这个东西的时候,我们再去强调这个内容,好那么到这块为止呢,我们就所有的配置文件就搞定了。
我来说两句