温馨提示:文本由机器自动转译,部分词句存在误差,以视频为准
00:00
好,那接下来我们就开始制作拉链表啊,那老规矩啊,我们还是先看一下这个拉链表的表结构啊,那表结构呢,我们还是看三个方面,那分别是行列以及分区对吧?好,那现在我们先拿到这个拉链表的这个建表语句啊。好,放在笔记当中,来,大家一起来观察一下啊,我们先明确一点啊,就是呃,拉链表也是这个用户维度表,它的每行数据是什么啊,每行数据是一个用户的一个状态,这个一定要搞清楚啊好,那接下来我们再来看它的字段啊,那字段呢,我们先看这部分啊,这一部分其实很简单,都是一些用户的基本信息啊,我们就不再赘述了啊好,往往下看,下边还有两个字段啊,分别是开始日期和结束日期,那这两个字段呢,就是拉链表所特有的字段了,对吧?啊,那这个一定要注意一下,好,那它的字段呢,其实也比较简单啊好,那接下来我们再来看一下用户维度表,以及这个拉链表的分区规划啊好,我们打开文档往下翻。
01:00
来大家看啊,那这个就是拉链表的分区规划啊,我们先来观察一下它都有哪些分区啊,那首先这儿有一个9999分区啊,那除此之外呢,还有一个每日的分区对吧?啊OK,那接下来我们再来看一下每个分区当中存放的都是什么数据啊,那先看99999999分区里边是不是存放了一份全量的最新的用户数据啊。啊,是一份全量的最新啊,那OK,那其余的分区当中存放的是什么呢?其余的分区当中存放的是当日过期的用户数据。啊,那这个我们怎么去理解啊,什么叫做过期的用户数据啊,啊,其实所谓的做过期的用户数据指的就是用户的历史状态。没错吧,那也就是说我们总结一下啊,9995分区当中存放的是所有用户的啊,最新状态啊,那剩余的每日的分区当中存放的是什么呢?存放的就是用户的历史状态啊。
02:00
OK,那这就是用户维度表,以及这个拉链表的分区规划。
我来说两句