00:00
好,接下来呢,我们来讲一下这个机架感知。然呢说的有点晕是吧,那其实呢,就是副本存储节点的选择。也就是说你这里面,比如说咱默认是不是三个副本啊。那三个副本,我这三个副本存在哪了?比如说你这个机器上有1000个这个服务器。那你是三个副本,那我这三个副本往哪个节点上分呢?跟什么有关系呢?啊,要解决的是这个事儿。那我们来看一看啊,官网上是怎么说的。它它S之后这地方叫date Rep数。玩具的。对吧,啊,然后这块呢,是范的。往下走。这个呢是副本。存储的位置是吧。First baby is that。再往下看,看哪块呢,看哪块。
01:04
叫风kiss。普通的。地址是吧。往往啊,我跟你说,你要英文差的话怎么办。我觉得他发现不一定多好。来,我们看一看啊。放到case啊,对于这个常见的情况。当复制因子为三的时候,其实为副本为三的时候,对吧?啊。嘛,对为3HDFS的这个存储策略吧。放在这里是。在本地机架上的一个节点上放着一个。不得关replace。On one roadde in the local。
02:00
第几页了?吧,能懂啥意思吧,在本地机价的一个随机节点就是。一个数据。Another on a different in the。另一个呢,是放在。也是本地几件,但是是不同的节点,这意思吧,还是几件是不同的节点。之后呢?And the last on a different。应了different。你说第三个放在的是不同机架不同。什么是计件啊?衣架,刚才我说挂那张图了。这是不是一个一个计件啊。一个月支架啊。那么来具体来校验一下啊,什么意思看。这是有三个机架。
03:00
三机二,每台机二的三台服务器,那就是说你现在创建一个数据,那么这个数据三个副本要存在哪里的一个问题。那么。第一个副本在所处的节点。如果客户端在集群外随机选一个,其实就是在本地的任意一个机架上。随机选一个极点,这是随机的第一个啊,具体最近嘛,在一个极架上距离都一样。比如说选择零号。主要解决是第二个放在哪。第二个副本和第一个副本位于。相同机架随机节点对吧,那就说这个机架衣上啊,任何一个放着它,放着它是不是都OK啊。那假如说我们放在了A1。那么第三个怎么放?位于不同机架。极节点,也就是说不同的几价肯定不是R1了,那也许是R2,也许是R3。
04:04
然后呢,这个节点任意取就行了。那你说他为什么这么玩?首先他第一个考虑的问题是不是我这个IO传输的距离最短了。哎,然后快速的一个备份,那另一个问题呢,考虑了是不是你这个整个机架如果要崩溃了。数就没了,哎,我在另一个支架那是。考虑安全性。所以说优先考虑的就是。之后安全和可靠性。那这个呢,是2.7.2版本的啊。可以给大家说一个老版本的。之前我也没讲哈。这个这地方问的确实比较少啊。目前为止没有提出这个,呃。有学员被问到这块啊?那老版本是这样的啊,先存在这群节点,那它第二个副本主要是存在哪呢。
05:00
存在的这个其他机架的是节点,第三个呢,还是其他机架这一节点。那这个是不是IO。是不是就大了啊,那速度是不是就慢了。这一项。但是它可靠性高一。他这个是2.7.2的这个付款选择啊。
我来说两句