温馨提示:文本由机器自动转译,部分词句存在误差,以视频为准
00:00
好,那我们现在开始编写用户维度表的装载语句啊,由于用户维度表的首日装载和每日装载的逻辑是不同的啊,那所以说在这儿我们需要分开讨论,那现在我们先看首日装载啊,那拉链表的首日装载呢,我们要做的就是一个初始化的操作,那具体的工作是什么啊,就是将截止到初始化日期的全部的历史用户信息一次性的导入到拉链表当中啊,那当然在导入的过程当中,我们需要诶做一些额外的处理啊,比如说用户敏感信息的脱敏操作,那比如说我们需要给他加上两个字段,一个是开始日期,一个是结束日期啊等等啊啊,那现在ods user这张表的第一个分区,也就是2020年6月14号的分区当中存储的就是全部的历史用户,那所以说我们要做的实际上就是将该分区的数据读取出来,然后呢进行处理,处理完之后放到拉链表当中,那当然我们要注意放到。
01:00
拉链表的哪个分区当中呢?OK,放到拉链表的9999分区当中啊,为什么?因为我们现在首日同步过来的数据都是最新状态对吧,最新状态就要写到9999分区。好,那这就是我们首日装载的逻辑啊,OK,那接下来我们看一下这个装载语句,其实装载语句比较简单啊,所以在这儿呢,我们就不再手写了啊,我CTRLC把它粘出来,那一起来看一下。那首先我们看下边啊,那这个状态语句呢,是从OD层的user引表当中的14号的分区当中读取我们所需的全量数据啊,这个没有问题对吧?OK,那大家再注意一下,那此处我们对email用户敏感信息进行了MD5加密,其实就是这个脱敏的处理啊,对吧?那OK,那接下来再继续,那看这个位置啊,我们在这张表原有的字段的基础之上,是不是又加上两个字段呀,对吧?而且这两个字段呢,是固定的值啊,一个是2020杠零六杠零四,一个呢是9999杠九九杠九九,那这两个值分别是什么啊,很简单,那就是我们前面提到的开始日期和结束日期。
02:13
啊,OK,那把数据读取出来,我们也做完这个相应的处理之后呢?那是不是就可以把数据写到维度表当中了,没错吧?那注意观察数据写到了这个维度表的哪个分区当中,是不是9999分区啊,啊OK,那这就是呃,拉链表的首日装载的SQL语句啊,相对来说其实比较简单啊。
我来说两句