00:00
啊,那关于HB的特点呢,我们简单介绍一下,简单介绍一下,第一海量存储,那大数据的一个存储方向都有这个特点,是不是啊,列式存储啊,它是基于列来的,基于列来的,而且看一下注意啊,慢慢的进行名词了,从现在开始,它这里边列式存储啊,其实说的是列存存储。列足啊,稍微记一下,那你想想看,它既然叫列足,你想想看这个东西是什么呢?集合列的家族对吧?把列的家族,那我们知道啊,MYSO当中啊,它有很多很多的列,那在HP当中呢,它将这些列啊集合在一块,形成了一个家族啊,它有一个列足的概念,那你知道列足下面其实存的是很多很多的一个列啊,是这样的一些东西啊,大致了解一下,然后是根据列足来存储出去的列读下面有很多很多的一个列啊,列图在创建表的时候就必须决定。列组,在创建表的时候,这个列组就你想想看,你在MYSO当中建表的时候,你是不是要必须要指定列对吧,这个列组就相当于你必须要在创建h base表的时候,必须要指指定出来,但是它这个列呢,不用。
01:06
它的一个列是不用的。他的用的。它是基于这种列子来存储的,它的列是。因为涉及到如果跟MYL对比的话,大家可能就想不明白,这个东西其实在h base当中啊,它的一个列没列,没列是h base当中的数据。他是他的数据。你不要想着那个搜索当中那个列啊,跟那个没有关系啊,跟个没有关系,它在HP当中,它的里边的所说的列啊,都是HP组的数据啊,真正的一个数据啊,这样知道了一个点啊,是大一个数据这样的。啊,然后第三个我们极易扩展。极易扩展。那还是体现在。第二,第一个。基于处理能力,基于存储的存储的扩展,大家都知道对吧,因为我们之前所说的h base呢,它是一个基于还是DF。
02:06
构建起来了,又有一个框架,又有框架,然后那它的一个扩展性,存储的扩展性,其实就是HDF的一个扩展性,那它还有一个处理能力的一个扩展性,处理能力的扩展性。那这个扩展性指的是什么呢?Ready so呢是它核心的处理,怎么理解呢?DN大家都知道了,那你想想看,你要是想整个的数据量大了之后,你要客户端来访问的时候,你增加DN的一个什么。个数,就是增加对灯录的一个台数,是不是能提高整个什么HDFS的一个。业务处理能力啊,读写对吧。因为实际的读写都是找的带no的呀啊,那这一款它里边也有一个核心的就是搜,就涉及到这些读写操作都会找这个搜啊,它就类似于这个对not啊,对not它是处理客户端的一个读啊写啊,增加改查的一些请求的一些请求的,然后我们指的这个地方处理能力的一个扩展性呢,就是说我们可以增加微serve这个服务的一个函数啊,横向扩展它是很方便的。
03:18
它是很方便的,那所以说它这个扩展性体现在两方面,第一个是业务能力,第二个是存储能力。然后还有个高发高并发。它这一块呢,高并发其实跟刚才所说的那个RS这种东西也有关,那RS函数多了。他这个并发性能上去吧,因为每个人分摊业务就分摊下来了,对吧,分摊下来了就是跟他的一个扩展性也是有关系的,然后还有一个稀疏。吸收性啊,这个指的什么意思啊,任何基于列存储的一个。数据库它都有系数性,系数性那这个系数性指的是什么意思?MYSO大家比较熟对吧。来看一下买所有的一个表呢,是这样的。
04:05
上面有表明,然后有列,然后里边的字段,这个是列名对吧,这个是具体的你每每一个什么数据,假如说ID,什么name啊,性别,什么地址等等这些情况,然后如果说你要存数据的时候,针对于这一行数据。你这个地方不存没有数据,它至少默认有一个档吧,那也是有数据的,对吧。比如说这边为空啊,它不是空了,那不等于空,这要知道吧,啊这能理解的OK,也就是说在里面三个当中啊,传的数据你不可以这地方就空着。就说我银行数据,我ID有我我名字呢,张三也有,性别呢,来,然后最后地址呢,我空着不行,咱们生活当中它不允许这样存储吧,哎,这条数据插不进去的。它是一个,它不是列稀疏的,这个叫什么。
05:03
不知道叫啥是吧,矩阵说就说矩阵了是吧,那你这这样去理解吧,就是说它这地方不能为空是吧,那稀疏的呢,对比一下。就在当中啊。HB当中,假如说还是同样的,它这边当然就不是那个列了,它是列,它是列足,然后列足下面会有很多列对吧?啊有很多列,它这个列啊,如果说你这个ID啊,假如说ID为一的,你这个列没有,你就空着。你就空着,然后这个列有呢,就有这个列有就有,然后他的一个数据存储的,整个的情况就是这样的。稀稀疏疏的这种的,这个就是体现它的一个稀疏性,那没有就空着,它不会给他一个默认为钠什么的,没有这种东西没有什东西没有就空着。你有就有,没有就没有,这是体验的那个吸收性。
06:02
啊稀数性,那我这个,哎,我只有这个啊,其他两个都没有,没有值,那就空了啊是这样的,它这边就是稀拉拉对吧,哎,就空了,是这样的。好,这是它的一个吸收性啊,吸附性的一个问题。OK,这是它的一个特点啊,大家相对来说就是稍微记一下,记下。
我来说两句