00:00
好,接下来呢,我们讲一下这个第六章啊,电子的。这一章这一章呢,是面试和开发的重点啊,首先6.1呢,属于这个工作机制。肯定是面试的重点啊,数据的完整性,这个属于呃,常识性了解就差不多,呃,掉线实现参数设置啊,常识性了解,下面这个回新节点推旧节点,这是开发的重点,也说运维的重点啊,准确点。重点这个带着弄的这个多目录配置,这属于开发开发了解内容吧,也。OK,那是这么几个,那么下面呢,从那个工作机制,比如说面试的重点开始啊。内弄是如何工作的?首先呢,这里面有三个这个数据节点,一个内弄,内not里面呢,存放的是原数据。呃,这种里面呢,存放的是实实在在的数据啊,实在的数据,以及呢,它的校验和时间戳数据长度啊,这。
01:02
的几个信息。那么在带动的启动。比如说一上店他干什么,干什么事情呢。向内弄的。注册。什么叫注册啊?告诉他我是不还活着,而且我这里面存放了BLOCK1BLOCK3啊,哪些数据。他要告诉这个那个。这是叫租车。注册完之后,哎,那就说他向内部弄一注册,内部将这个信息写入到他自己的原数据里面去。之后给他应答说,哎,你已经写入成功了啊。那他俩呢,就正常的启动起来了啊。然后以后每周期也就一小时,还要上报这个块的信息。是为了保证这个机器的这个可靠性啊,比如说你这一块的数据已经挂掉了,或者说你不存在了,然后你这边还还告诉这里面还有数据,那是不是机器就乱了。
02:03
那什么情况出现这个这个数据没了。是可以RM,你知道它存在哪吗?说非常清楚啊。那么一个长长的一个路径下面啊。万一哪地方?啊,坏了,这个那个我还不知道,那会出大事情。这时呢,他定期每小时更新一下。OK,这是每小时更新一下块信息,那么它这里面还有一个叫心跳。每三秒一次。心跳有点晕了了,学过这个互联网开发或者通讯的应该都知道这个心跳。人要是没心跳了是吧?就忘了啊。所以这个呢,相当于这个内note和note始终保持着信号的一个往来哈,每三秒一次。心跳返回结果带有name node给该datanode的命令。也就说呢,这个心跳里面还掺杂着一些内脏的对他的一些操作。
03:05
其实这个绩效很重要啊,呃,像之前呃,做过一个五,做一个校是这个铁路的啊。铁路呢,他那里面有一个。战吧。就是开地铁都知道吧,地铁是不是有这个驾驶员呢。或者高铁都有用驾驶员吗?他们现在有出来一个什么设备呢,将那个。一个设备跟你的心跳是绑定的。如果你这个人挂了,突然间猝死。这个车呢,就是地铁这个车会紧急刹车。就有出现过啊,不是国内啊,国外有出现什么呢,这个驾驶人员突然间挂掉了,但是这车呢,还是一直在往前一路狂奔。这是很危险的,你这一车人是不是?上千人啊,是。人多一些,都上万人啊。这是很危险,那怎么办呢?那你这个人一旦呼吸心跳没了你。
04:01
停车基本就安全了。这是这个心跳,每三秒钟一次。那么是不是我这三秒钟我没有收到这一次心跳针?我就认为你这个电动的挂了呢。那有点这个要求太苛刻了是吧?啊,这个受到一些干扰啊,啊等等一些情况都有可能啊,这300个销没收到。那么现在问题来了,那多少时间没收到这个调任,认为这note挂了呢?这里面是十分钟加30秒吧。边的预习的应该知道十分钟加30秒,如果十分钟30秒没有收到这个对号的跳帧,则认为该节点不可用。他一旦标记你这个节点不可用了啊,它不会向你这个节点上传输任何的。以后都不会用你了。呃,除非你这个节点退出,再重新启动。大还能正常的这个工作。因为他认为你已经故障了啊,这个存在你上面的数据呢,已经不安全了。
05:04
所以说呢,这是这个原理啊,稍微巩固一下。首先电能的启动的时候对。将自己的原数据向这个内部进行破坏。报告完之后,内动的啊,写上写在自己的原数据里面,然后并通知电动的说我已经记录完毕。进入完毕之后,以后每周期一小时上报你的信息。更实时更新这个原数据。那么另一点呢,就是这个动的和电动的,它们之间是有通信的,靠的是一种心跳帧。啊。同时呢,这个心跳过程中呢,DA not还会给这个not啊发送一些啊命令等等。之后那么多长时间认为这个date动作。挂掉。如果判断到死刑。只要你这个心跳帧在十分钟30秒内。
06:02
没有收到,就认为这个内容呢,已经挂掉了,只要他挂掉,那以后就不会在这上面存放任何的内容。要注意哈。这是戴总的工作机制。
我来说两句