00:00
好,刚才呢,我们做的是对于数据库的一系列的操作,增删改查,接下来呢,我们就是要具体到数据库往下一层就是表了吧,哎,对于表的一个。增加干啥增加干啥啊,首先还是创建表,创建表那这个语法就复杂很多了啊,我们很多到现在为止还没有接触到啊,我们接触到创建表的语法呢,现在来说还是很有限的,我们来把这个拿出来看一眼。好,我们一个一个标一下可瑞关键字对吧?创建一张表,然后这个table也是关键字吧,创建表,Create table,然后表明,然后even this中括号表示。就是可写可不写吧,可写可不写的判断,然后这个你看还有一个中国话X是什么意思。
01:02
是外部的对吧?啊,也就是说你可以加一个关键字叫外部的,那也就是说我们之前没有加关键字的应该都是内部表吧,内部表那具体到明天的时候才要讲内部表跟外部表有什么区别啊,现在你知道就是创建一个表,Create table,然后加表明,那表明后面跟着就是具体的字段嘛。哎,字段看一下啊,字段名数据类型吧啊数据类型,然后这个中号也表示可有可无啊,这个是什么东西啊,Common就注释吧,对于列的注射,然后这个逗号表示有多个列了啊,有多个列。然后你看括号结束了。然后这还有一个comment,这是表注释吧,啊,它是表注释。这些东西呢,在数据库当中,就是在MYS当中也有所涉及,所以这块东西大家理解起来还好,那涉及到这一块具体的内容,我们先把这个说一下。
02:12
这个是什么?如风暴的吧,哎,如分的就是你的数据格式的一个什么分割符啊,字段与字段的分割符map啊之间的分割符是什么,然后ARA的分割符是什么,是不是都在这个属性下面去具体的去指定啊,但是每个指定的名称不一样嘛,字段是fields communityin的BY,然后像数组map是什么?Collection吧,然后如果是具体的map结构里的KV是什么?是map吧,卖kiss,然后抓他呢?它没有什么表志啊,对吧,没有它没有,因为它是表示的具体的,它里面表示的是存的,具体的还是一个一个的结构,它可以存string类型的,那string类型你有什么,那还是逗号呗,就是跟你的字段一样吧。
03:17
啊,或者你里边放的是ARA,或者放的map,那你a map是不是前面已经定义过了呀,啊,所以说它的一个结构体啊,是不用再额外定义的啊,不用额外定义的,也就是说格慢的这个我们是知道的,知道的好,然后相对来说还熟悉一点的是这个东西,虽然我们没有用。但是数据库里边我们用了这个location关键字,数据库里面我们表示的你加了这个关键字,是额外指定什么数据库的存储地址吧,那表里面加这个呢,那这个表存储在哪?哎,你也可以在创建表的时候指定版,如果不指定它是不是默认在什么user have will house,然后以及那个数据库名那个下面啊,还是这样的好,然后接着讲我们比较不熟悉的内容。
04:09
你现在就听个大概就有个印象啊,当然具体的这些东西我们肯定会下面会具体展开说的。首先第一个。叫partition的。Partition什么意思啊,分区呢?哎,在have当中它是也有分区的概念了,但是你要注意的是,这个分区跟。Map中的分区是不一样的。它是不一样的啊,你首先要知道这个它虽然也叫分区,那后面就是分区的一个列对吧?啊列的类型,然后是common,这个都很好理解,然后它还可以多级分区吧,看到没?就是你按多个列来分区的话,就叫多级分区。多级分区,你要知道的是,Have当中表达一个分区跟me那个分区是不一样的。
05:08
是不一样的,这是分区,为了存储的方面好,接下来还有一个。Class呗,然后他后面也是跟着什么名列名对吧?啊跟着列名。你要注意啊,它创建语法当中,你要注意每个细节,你看啊,它虽然这个partition by跟这个BY都用的是列宁,但是你要注意一个在这个地方指定类型,一个不指定类型。那你通过这个两个一个指定类型,一个不指定类型,能感觉到是什么。给你的第一印象能反你大脑当中反过来第一印象能感觉到这两个的区别,这两个字段。
06:01
那你想想看,他这不指定类型,为什么可以啊。一般呢,你存在一个表里边这个列啊,无论是哪个列,他都要指定类型啊,它这个地方没指定,说明在其他地方会指定吗。说明在其他地方会指定这块的一个内容,它的一个量啊,其实采用的是。这里边儿的一个链。你这里边不是指定了类型了吗?哎,它一定要跟这个对应起来,就是classed呗,但是分区你看它这块额外又指定类型说明什么,它的链不在这个里边。啊,你要有这个意识啊,你要注意一下啊,注意一下啊,然后classed也好,还有这个part呗也好,一个分区一个叫这个叫分筒啊,这个叫分筒,反正就是大家听了越越越听越模糊是吧,越听越晕,这个分筒跟分区啊,其实都是为了解决数据量过大的问题,你想想看他这分区分筒,你想想看,你虽然我们说这个分区跟MAP6分区不一样,但是你MAP6分区最后是不是形成了多个文件啊,对吧?啊分区形成了多个文件,它是为了把一个大的数据变成多个小的数据吧。
07:34
其实在汉语当中啊,它这种分区分土也好,它也是为了,因为这种数据量特别大的时候。他要把数据分开存储,只不过分区,它分的是文件夹,分桶分的是文件啊,分统是分的文件,也就是说,嗯,再说大家可以明了这个分筒。
08:00
跟麦热里的分区是一样的,是不是大家一下就彻底懵了,为什么他他这个叫分区,这个叫分头,然后然后他的分区跟那热的分居然不是一个东西,然后他的分筒跟他的分区是一个东西,那没办法,他就是这样的啊,他就是这样的,就说这块确实容易混淆,因为它两个都叫分区,但其实它不是一个东西,但另外一个东西叫分筒,它就跟他妈的分区又扯到一块去了。你稍微理解一下,到具体我们肯定会讲那个分区表分组表啊,分区表分表,然后看这个。所里的bank存储吧。Sort by排序排序排序就是说他在创建这个什么表的时候,就可以指定按什么字段进行排序吧,哎,就创建表的时候,但是这个这个东西啊,倒用的不多,好像用的不多。
09:06
因为你正常的创建表的时候,没必要做这个操作,对吧,没必要做个操作,你在读取的时候,你要按什么排序,就自己去排序就好了,好然后就剩最后这一个了吧。这个是存储吧。还有什么文件格式存储的,那现在我们这个是什么格式啊,这里边呢。就TC吧啊TXC它里边肯定还有其他的一种不同的存储格式,你像哈杜当中是不是也有很多啊,压缩文件的方式对吧,那你压你存的是压缩文件,那你的一个形式肯定是压缩文件的形式。啊,压缩文件的形式。好这块呢,因为这个每一个点啊都很多啊,就是现在你需要了解的,你你现在只要需要记住的是这里面标红的东西就够了,标红的东西,这这标红的东西就比较简单了吧,就是创建的表,然后加上字段名,然后是什么。
10:13
指定的分割符吧,啊,额外的记一个这个东西也不难吧,啊,指定位置啊,你需要记住这些东西就行了,至于分区分头这些东西,你稍微有个印象啊,稍微有个印象,到时候我们再讲它的时候,哎,有这个印象就够了啊,现在你不要强行的记,强行的记没有用,你记越记越混,越记越混了,然后你可以去看一下这些具体字段的名字,然后是创建分区表,创建分统表,然后这个刚才说了不常用的吧,是不常用的,然后这个里边具体的肉ma的,它是这里边用就有很多了吧。哎,这个。字段与字段之间的分隔符,对吧?啊,还有一个collection items。
11:04
Map跟瑞吧,哎,它之间的分隔符是怎么样的,然后map k指的是你map kv,哎中间的分隔符是什么?最后还有一个行分隔符,它默认的就是刚才也没必要去改变它什么内容,改变什么内容,你自己去具体的看一看就OK了,它这里边具体存储的指定的文件格式呢,你现在知道它会有很多种不同的格式就够了啊,具体它格式是什么?这些东西你现在不要紧,因为后面都会具体的展开讲。啊,所以说你看啊,他的一个创建表的一个语法还是相当复杂的,跟数据库比,就跟他搜个比,复杂太多了啊,复杂太多了,然后跟他自己那个创建数据库比,也是复杂很多了。啊,他这个表很复杂的,他要把表建的这么复杂,原因就是因为他第一要面向的是数据量很大的啊,收据量很大,第二他要做的操作会是很复杂的,因为它要涉及到数据分析啊,啊数据分析啊,这创建表的一个语法。
我来说两句