温馨提示:文本由机器自动转译,部分词句存在误差,以视频为准
00:00
好,那接下来我们看收藏实时表啊,那这张表和我们刚刚所讲的加购物车实时表实际上是一样的啊,也是一个周期型快照实时表啊,并且呢,也是每天一个全量的快照啊,OK,那接下来我们老规矩还是先来分析一下它的表结构啊,那我们把它的建表语句先拿出来。好,大家一起来看一下啊,那首先我们先来明确,那这张表的每行数据应该是什么,那它的每行数据呢,实际上就应该是一个用户对一个商品的一个收藏啊,OK,那这就是它的行,那接下来我们再来看那它的列啊,也就它字段有哪些,那同样的字段我们在这儿也是关注两部分,一部分呢是维度外建,一部分是度量值。表,OK,那接下来我们再来看一下它的度量值,那这张表呢,实际上没有一个明显的度量值啊,那所以说它的度量值实际上就是我们之前提到那个次数对吧?啊,OK,那这就是它的列啊,那最后我们再来看一下它的分区规划,那其实这张表的分区规划呀,和我们前面讲到的加购物车时表的分区规划也是相同的啊大来看一下,那首先呢,是按天分区,每天的分区存放的是什么呀?是当天的全量的收藏记录,也就相当于是一个全量分区。
01:24
OK,那这就是这张表的分区规划啊,好了,那现在我们就把这张表的表结构讲完了啊,那接下来我们紧接着就来说一下它的数据装载啊好,我们打开文档来往下看。啊,那这个呢,就是收藏表装载时的数据走向啊,我们来一起看一下啊,大家来看啊,那这部分指代的就是OD层与收藏相关的业务表啊,那它就是收藏时表的数据来源啊,那下边呢,指来的就是收藏时表啊,那我们假定今天是6月14号啊,那看一下从ods层咱能拿到什么数据。啊,显然是全量的收藏记录对吧?呃,那现在我们要做的工作呢,其实就是把这部分全量的数据拿到,然后呢,放到事实表当中。
02:07
那关键是放到时表哪个分区啊,那这个问题已经问了很多遍了,对吧?那放到哪个分区实际上是由下边这张表的分区规划去决定的,没错吧?那咱们这儿做的一个什么分区啊,是不是一个全量分区,没错吧?那所以说全量数据是不是放到当天的分区就OK了啊,其实比较简单啊,好,那接下来我们再再来看一下第二天我们要做的工作是啥啊,第二天你会发现咱拿到的仍然是全量的收藏记录,对吧?啊,那所以说我们接下来要做的工作是不是跟第一天是一样的呀,对吧,也是把全量的数据放到当地的分区,那其实后边每一天都是相同的操作,这个就是收藏事实表,哎,它装载时的数据走向好,那接下来我们再来看一下它具体的装载语句啊来往下翻啊,刚才提到了啊,那这张表第一天和后续每天装载的逻辑都是相同的,对吧?那所以在这儿呢,其实咱们不用区分首日和装载和每日装载啊,咱只看一个就可以了啊,咱就把它看一下吧,啊,CTRLC。
03:03
来拿到我们的记当中一载是到我们的数据对吧,那当然我们的数据呢,就在14号的分里,OK,那咱把所的所有字都拿过来啊,正好OS层的这张表当中就了字用表把段把数据insert d2。啊,OK,那大家可能又会想了,那在这儿呢,我也没有做任何处理啊,对吧,是不是直接把数据原封不动的拿过来就写到这张表里去了呀?啊,但其实不是这样的啊,虽然我们这儿没有什么逻辑上的处理,但大家要注意的是什么呢?哎,它的数据的存储格式发生了变化。对吧?ODI层纯拉罗文件,那DWD呢,是park的劣势存储加拉走压缩对吧?这是大家要注意的啊,OK,那这就是DWD收藏表的装载语句。
我来说两句