00:00
那么咱上午呢,主要给大家介绍的是关于我们的clean house,它的一些我们的入门介绍,对吧?那具体呢,Clean house是什么?它其实呢,也是一个基于劣势存储的一个数据库是吧?那么主要呢,用于我们这个OLVP啊,主要用olp,那么它的一个好处什么呢?能够使用circle口L查询实时对吧,生成分析对对语言,其实这个都有好处,然后这个具体怎么安装对吧?这块看我们的安装过程就行,然后数据类型这里边呢,有关的整数的,有浮点数的,然后有我们这个December的,有我们的字串的,对吧,字串里边是不是有string,还有什么fix string啊对吧,有日期的对,有枚举的对吧,这类型,然后接下来在咱们这里边呢,给大家介绍了关于我们这个表准引擎,我说表引擎呢,那其实这里边对吧,有有一个很重要就是咱们这墨train啊墨train那么在它的基础上呢,还衍生了很多我们这个对这个子数出来对衍生出很多小弟出来,对吧?那么咱们上午主要给大家介绍什么呢?介绍关于我们的墨train对。
01:00
啊,这个末日tree呢,它啊有这么三个长的属性对吧?一个是part by,按照谁来进行分区对吧?那么这个呢,其实就是什么呀,就咱们现在在执行对吧?我们这个多次插入的时候,它并不会马上进行分区,对,那需要我们手动的对着做分区之后,它才会进行分区,对吧?这盘之半需要了解,然后接下来primary,这个呢,你要知道对吧,这个叫主键,但是这主键呢,它有唯一的一个约束嘛,没有,它没有唯一约束对吧?它其实只是建立一个一索引,对吧?然后重要的是哪个呢?是我的honor。啊,这是order bad对吧,他的地位啊比我们的primary key对吧还要还要重要,在某些场景里边,你可以比用primary key,但是你不能没有这些东西对吧,你不能没有些东西对吧?那么这个呢,它主要是对吧,现在啊我们理解主要是对吧,按照指定的我们这个字段对分区内的数据来进行排序啊对分机内数据来进行排序对吧?然后接下来给大家介绍什么二级索引啊对吧,然后呢,这个数据TTL,那么这两个呀,二级索引它是实验性的对吧,然TTL呢,那么这块大家注意它和呃,我们这个对这个这这个red啊,它的一个超时实验的不太一样,短red一般是我是业务需要,然后设计它,然后它呢,一般什么从优化的角度上去考虑啊,从优化角度考虑对吧,然后接下来咱们再往下走了,再往下走了,那么除了我们的me tree之外呢,在me tree下面对吧,还有引申一些对吧,我们这个引擎对吧,这里有一个叫releing啊me tree。
02:35
啊,这东西本身这意思是什么呀。替换是吧,对吧,那咱们现在呢,看一下它本身啊,是我们的water tree它的一个变种啊,它的变种,那么它存储的特性呢,完全继承我们tree,对,也就是说咱们在存储的时候,它也可以指定partition by,也可以指定primary key,也可以指定order by,对吧?那么只不过呢,在咱们这个前面基础上,它还多了一个什么呢?多了一个去虫的功能,对吧?大家想想咱们说这个东西,原来我们这里边primary key它是不是没有我们的驱虫的一个作用啊,对吧,它只是一个什么,它其实只是呢,对吧,去做一个我们这个一级索引,但是我现在要驱虫,那怎么办呢?对吧,那这个时候呢,你可以使用我们这个releing what tree,但是注意对吧,这里的去虫啊,那我得给它加上对吧,它这个双引号对吧,那你得特殊对待它,就像咱们在这个primary key里边,那我得特殊对待一样,对吧,得特殊对一样,那么咱们现在看看驱虫,它是怎么驱虫呢,对吧,那么。
03:40
这个时候咱们看一下,如果要去虫的话,它只会出现在合并的过程中,要注意啊,就是说假如说我没有合并,那么这个时候呢,它是不会去重的,对吧?而且到底什么时候合并,咱们说了可能十到15分钟在后台对吧,你能你能你能你能去决定说现在你是不是该合并了,对吧?这个时候你其实你自己如果是不手动去做的话,你没有办法预知这个事,对吧,所以说呢,那么咱们现在你想去特别精准的说,诶我现在要去重对吧,这块呢不太现实对吧,这是第一个,那么第二个,那么咱们现在驱虫范围什么样的呢?对吧,它只会在分区内部进行驱虫,然后呢,不能执行跨分区的驱虫。
04:21
对吧,他只能把当前分区对吧,这个这个驱虫给他去了,但是如果说我现在跨分区了,那这个呢,它其实呢,对吧,这个实现不了对吧,所以说老那那咱们现在想啊,这个驱虫对吧,和我们理解的密等性对吧,那一样吗?就你看他这种驱虫的描述,能不能实现密等性的效果,实现不了啊,你想一想,我现在假如说我这一个表里边有三个分区,然后三个分区呢的去除之后都有咱001,都有001,都有001,那你说能实现B的性吗?说实现不了,你整体的数据是不是还在呀,对吧,所以说呢,一般去中说什,那你说这有什么用呢?对吧,它的意义在于什么呀,也是从我们这个空间的一个角度上对吧来考虑,对,我发现这里有可能这个分区里面都有一些重复数据,对吧,那怎么办呢?对吧,咱们现在呢,来把一些重复的给去掉对吧,但是注意啊,它并不保证没有重复数据出现啊,就是我现在我这里面再往来来访的话,对吧,如果说我没有去做到word的话,它呢,可能还会重复数据。
05:22
对吧,所以说这块呢,它其实只是从我们这个优化内存的角度上来去考虑它,对吧?那么具体咱们通过案例来演示一下对吧?呃,那把这个东西呢,来复制一下,他说C还是创建一个表啊,那不一样就在哪呢?不一样就在这了,咱们现在的引擎不是墨日tree了,是replacing末tree,对吧?然后呢,咱们现在这里有一个create time,注意啊,这个create time什么意思呢?它其实呢,可以理解成为版本对吧,版本那么重复数据也说驱重的时候保留版本字段,这个值最大的,如果不填那默认的,那么咱们现在按照插入数的保留最后一条什么意思,就是我现在这里边对吧?那么我现在呢,这里创建时间相当于我这里面重复数据的版本。
06:06
对吧?重数据版本,那如果去重的话,那咱们把这版本小的给干掉,把版本大的呢给留下对吧?把大留下对吧?那如果不写的话,那它会按照什么呢?按照咱们的插入顺序把最后一条给留下啊好,那咱们现在呢,来测试一下啊,在这里来到我们203中,然后把刚才这个代码直一下,对吧,这个是revising virtual,然后接下来咱们向我这里边插个数据,把这些东西CTRLC啊CTRLC往里边插些数据,然后咱们现在呢,去select here from t_order r MT啊咱从这表里查,大家看一看当前咱们现在这张表里边那么102,然后呢,咱们SQ002的2000的这个数据是不是是不是重复的呀,同学们对吧?包括什么?包括你看现在这个什么102到什么SQ002,这些东西是不是都是重复的呀,对吧,那么咱们现在要干什么呢?那要对它做驱重,本身咱们现在这个引擎啊,要支持驱虫的,但是咱们要驱虫的话,那你应该干什么,你们手动得合并一下呀,对吧,就。
07:06
一下插入进去之后,他拿到有驱除效果没有,咱们得合并之后才看到驱除效果,那何必呢,对吧?来在这里咱们上午写过的命令吗?Op math,然后接下来咱们的table,谁呢?T,下划线,我们的order r MT,然后进来final,别忘加啊K,如果不加final不会报错,但是呢,你可能看不到这效果,对吧?来在这里我执行完之后我再去对吧查询一下,那么查询完之后发现咱们现在数据是不是刚才是六条,现在是四条了呀,是把重复去掉了,把虫去掉之后,咱们现在要验证这么几个事,同学们,我问大家去虫是根据主线去重的吗?如果根据主线去重的话,那这两个东西都不应该存在对吧?是不是只能存在一个呀,对吧?那么第二个咱们现在这个东西。这东西它俩完全一样,除非单位去掉重复呗,对吧?那所以说呢,去重它是以什么为单位的,是不是以分区为单位的,就说老师那你现在驱重不是按主键,然后以分区为单位,它按谁来驱重的呢?对吧?咱们这里不指定order by吗?你在order by中指定字段是什么,它的order y轴字段呢?来进行驱重对吧?然后接下来再往下走,同学们,咱们现在在这里102,然后SQ002对吧,那么这里呢,它的数据重复了,在这里102SQ里点这几条数据重复了,那么重复之后它保留的是哪一个呢?
08:30
啊,它保留是哪一个,它按着什么来保留,想想不有一个我们现在它的一个版本吧,咱们是不是有在咱们这个这个去中在创建的时候,它这里是不是有一个版本对吧?这里是不是有版本对吧?他按照谁对来去保留呢?按照创建时间,那创建时间的话,那咱们现在把大的保留下来,对吧?那你想又把大的保留的话,他肯定会从咱们这两个里边选一个保留起来,对吧,因为你看而现在这三条记录对吧,咱们现在11是不是比这个13是不是比11大呀,对吧?所以说它会保留到这两条记录,那我发现这两条版本都一样,那这以说按照谁呀,按照咱们插入的先后顺序对吧?按照咱们这个传入的它的一个呃先后顺序,这个呢是对吧,那这个是一个2000,一个的是一万二对吧,那么它在它的后边,所以说呢,咱们现在把这个给保留下来啊,在这里把这个呢给保留下来。
09:26
好了,这是关于我们现在这个mer tree啊,这个re replacer tree,那么它呢,执行的时候咱们可以得到这一些结论,首先第一个实实际上不是使用我们这pre啊,这个主键驱重的,使用谁呢?Order by对吧,作为我们这个驱重的键,然后接下来那么咱们去重的时候呢,不能跨分区对吧,只能对当前分区来进行操作,然后第三个,那么咱们要想看到驱虫效果,只有在咱们这个合并之后,对吧,就是执行我们这个刷新之后,那么这个时候呢,才能去重对吧,如果说我们现在重复了,那保留谁保留版本是最大的,如果版本值相同对吧,咱们现在对吧,保留我们这个最后一笔啊,其实这块呢,大家注意啊,你可以看一下对一般什么时候去重对吧,就是说咱们想释放空间了啊,这以优化啊好了,这是关于我们现在呢,这个replaing是吧,稍微停一下。
我来说两句