温馨提示:文本由机器自动转译,部分词句存在误差,以视频为准
00:00
好,那在建表的时候,我们可以选择合适的文件格式,那么第一个有text file sequence file,那这两个呢,都是我们所熟知的叫行存储,接下来还有orc pocket,那这个呢,是我们的列存储,至于我们到底应该如何从行列存储当中去选择,那当然要看我们的需求。如果经常我们要写的这个语句是C,诸如select新这样的语句,那么肯定行存储更好一点,如果我们经常写到的是select某一个字段,然后com的心sum什么值的时候呢,那这个时候肯定是列存更为合适一点啊。好,这是我们所看到它第一个航存列存的一个点。之后呢,我们可以介绍一下,在我们使用t file的时候,以及orc这种格式pack啊,类似于这样内容都可以使用啊。呃,那接下来往往我们使用这个文件格式的时候,往往离不开我们的压缩方式,所以我们把这两个放在一起去聊。
01:00
那在压缩方式当中呢,我们有default默认的这种啊,那主要从这几个方面,是否可切,是否需要安装。从这几个角度来考虑一下就好了,对吧,还有这当中呢,有g z b to,拉斯罗和snap,那其实生长环境当中用的最多的呢,是拉斯罗和我们的太比,因为他们都拥有着优秀的压缩能力。和以及压缩效率。啊,就是它压缩很快,而且呢,压缩之后数据量呢很小,那这个呢叫压缩比啊,那同时这边呢,也给他提供了我们具体主流的。数据它主流这种格式的一个内容对不对,好那我们就可以看到,诶,每一种压缩的速度,解压速度啊,以及压缩之后的文件大小,也有压缩比,压缩比啊,类似于这样子的,好,那这个呢,在生产环境当中,我们可以选择合适的,那也可以结合着。
02:02
文件格式加我们的压缩方式来共同使用,因为选择到合适的文件格式或者说我们的压缩方式,那我们之后查询的搜索包也会有更高的一个效率。OK,这是我们所说的叫文件格式和压缩格式。
我来说两句