温馨提示:文本由机器自动转译,部分词句存在误差,以视频为准
00:00
好,那接下来我们看活动委列表的数据装载啊,那同样我们还是先来看一下他每天的数据走向。来啊,那这部分内容指代的就是OD层跟活动相关的业务表,那当然这里边儿主要就是呃,活动表和活动规则表啊,那当然这两张表呢,就是我们活动维度表的数据来源啊,那下边呢,指的指代的就是活动维度表啊好,那假定咱们现在就是第一天2020年6月14号,那我们看从ods层我们能拿到什么数据。OK,那2020年6月14号的时候呢,我们会有一个全量的分区啊,在这个分区当中会有全部的活动的信息,那咱们要做的事呢,就是把数据从这个分局读取出来,进行相应的处理,然后呢,写入到活动维度表14号的分区里。啊OK,那第二天也就是2020年6月15号呢,那我们来看一下从OD层我能拿到什么数据。OK,仍然是全量的活动信息啊,那因为活动相关的业务表采用了同步策略,也是每日全量啊,那所以说我们首日跟每日的处理逻辑也是相同的啊OK,那咱要做的呢,就是把15号的分区诶里边的数据查出来,然后呢进行处理,然后写入到活动维度表15号的分区当中啊,那OK,那后边16 17 18、19也都是一样的啊OK,这就是活动维度表了,每天的数据走向啊好,那接下来我们再来看一下那这张维度表具体的数据装载逻辑啊,由于这个circle比较简单,那所以说我们这儿呢,也是直接看一下现成的结果就行了啊,就不再单独的去写了啊来可RLC拿过来,拿了之后呢,我们放到笔记当中啊,大家跟我一起看一下这个逻辑啊,那刚才我们大致也看了一下这张表当中的字段了啊,那根据我们的分析呢,我们大概能确定下来,那这张表,那它的数据来源呢?呃,有两张,那一张就是ods层的activity。
01:57
INF,那还有一张呢,就是ods层的activity rule,其实就是这两张。
02:04
啊,一个是活动信息表,一个呢是活动规则表,那大家要注意啊,那这张表我们实际上是以谁为主体的呢?是以活动规则为主体的那一行数据是一个活动规则,这个大家要搞清楚啊,OK,那所以说我们要做的具体的操作其实很简单啊,就是从这两张表当中去选择我们所需的字段啊,选完之后呢,把这两个子查询啊,通过一个join拼接起来,然后就能得到我们最终的结果了啊OK,那现在我们来看一下这个最终的装载语句,好,我们往下看,往下看,先看子查询。首先看这个大家看一下啊,这个从OT层activity,比如活动规则表的十四二的分区当中获取我们所需的所有字段啊,那然后呢,这个子查询是从ods层的activity in活动信息表当中获取我们所需的这个,哎,活动的基本信息啊,好,那完事之后呢,诶,让这两个子查询做了一个left join,因为活动规则是活动维度板的主体啊,所以在这儿呢,咱用的是left join啊好,那看一下连接条件,那肯定是用活动ID去进行关联啊,好,那最终我们就可以选择所需的这个各个字段了,那都选出来之后呢。
03:18
把这个结果哎,音色的or right到活动维度表的14的分区当中就可以了啊,那刚才咱们也分析了啊,由于我们活动维度表相关的这些表每天的同步策略都是全量,那所以说首日的处理逻辑跟每日的处理逻辑是相同的,那所以说在这儿呢,我们只看一个状态语句就可以了,好,那这就是活动维度表的装载语句。
我来说两句