00:00
然后我们之前一直所讲的这个,呃,它一边是一个那搜当中存的是原数据对吧,原数据,然后这个里边呢,是一个file hdfs吧,HDFS它这两个我们说它原数据什么一个对应关系是吧,其实这个对应关系不是不是一个数据啊,你要注意啊。不是说它有三个东西,一个是表结构,一个是对应关系,一个是文件,不是这样的,是不是有的人理解成这样的,有的人理解成这样了,是吧,其实它这个对应关系不是一堆数据啊,其实这个原数据呢,就是它的一个对应关系。啊,它们俩是互相映射的啊,映射的这你要注意啊,那我们可以看一下啊,首先我们很清楚的能看到HDF上的一个文件嘛,那你们就没人想看麦克里边的文件吗?都说了在那个库里边是吧?你也想看一下是吧,那我们就不用那个什么麦客户端进去了,对吧?麻烦看着不方便,那我们可以有个第三方工具吧,你们搜个药或者那都可以对吧,连一下我们那个哈102,然后有这个库板来了,多这个库,你看一下这里边的表是不是有特别多啊,找一下大概我们能认识的,呃,这个TBLS应该是什么tables吧?哎,点开看一下。
01:31
它能指明这个表吧,是不是我们现在have里边有这些表啊,然后它表的类型是不是有啊,哎,表的类型有,你看它还有什么,这这些是它这个属性吧,其他一些内容再往后翻一翻看能不能还有还有没有东西能看懂,后面好像没有什么我们能看得懂的东西了,是吧,而且它也都是为空为空,也就是说你看MYS里边首先至少肯定有这些表信息,它有吧,然后我们还要找一下什么DBS,应该是什么数据库吧,哎,数据库。
02:06
是不是数据库啊,一个default,一个还有DB DB two啊,那我们还关心的一个是什么呢?就是这个它位置关系在哪吧。位置关系我记得没错的话,应该这是什么函数是吧,它里面有什么函数,额外的函数,然后位置关系我记得没错啊,应该是这个ids这张表里存的,哎,不是SDS是吧?SS位置关系就是里边存的一些啊,具体在哪个地方,在哪个地方location吧,具体的地址。他所有的这些所有涉及到。这个表的信息以及一边是什么。HDF上的信息,你在MY里边哎,都能查到什么partition之类的相关的是吧?Partitions分区,你看你这是不是你所有表加在一块的一个分区啊,哎,它是存在这个里边的,存在这个里边的,也就是说所有你have里边能看到的内容啊。
03:12
都是MYSO里面所有的。你的DDL操作的语言啊,你想想看操作它影响的影响的数据在哪啊。是不是都是买搜克里面这些表啊啊,当然有很多表的内容,可能我们现在不太清楚,没有深究的话不太清楚对吧,但是基本的什么表表什么我们能看到啊,还有它每个表的一个位置关系也有啊,哎,都在这个MYS里面存着呢,就是跟开始我们讲的一样,Have,它本身是一个分析框架吧,它不存任何数据的啊,它不存任何数据的啊,你看它那个原数据信息,什么table啊,它那个表信息啊,位列信息啊,都放到MY了,然后以及这个这个是什么分区信息吧,啊分区信息。
04:03
那你看啊,它这个分区是谁的,是不是有一个表的ID啊,你再看这个表,它每个表是不是有自己的一个ID啊,啊有自己ID,因为它这个是我们从一开始删就是创创建一个表,然后删除一个表,删除一个表,删除一个表,它是主体每增对吧?啊自增的一个主键看见没对吧,能感觉到吧?啊删了之后它就不会补充了,补充了。就说它的所有的一个原数据信息啊,都在MYS,然后具体的数据信息呢,都在HDFS,然后当然这个MY里面存在这个原数据信息啊,就记录着每一个表与这个HDF上的一个对应关系,当然这个对应关系不是单独的一堆数据在have存着哈,肯定有同学是认为这个have呢,掌握了它对应关系是吧?啊它它不是这样的,它本身就是有很多的一个对应关系在里边,Have它只做数据分析用啊,它不存任何数据的,没有什么对应关系。
05:08
他自己没有什么对应关系的,对应关系也在这里边呢,在麦克里边呢。
我来说两句