温馨提示:文本由机器自动转译,部分词句存在误差,以视频为准
00:00
好,那接下来我们看优惠券维度表的数据装载啊,那我们还是先来看一下,呃,优惠券维度表它每天的数据走向是什么样的啊,点开这个PPT,好大家来看一下啊,那这部分内容指代的就是ods层跟优惠券相关的业务表啊,那这些表呢,其实就是优惠券维度表的数据来源啊好,那下边呢,指来的就是优惠券维度表啊好,那假定现在就是数据仓库,诶上线的第一天也就是2020年6月14号啊,那看一下我们今天能够在ods层拿到什么样的数据,好大来看一下。那ods层的业务表当中呢,会有一个当天的分区啊,那这个分区当中会存储截止到当天的,呃,我们这个全量的优惠券信息。啊是这样的啊,那我们要做的工作是什么呢?诶,那咱们要做的工作就是将诶这部分数据从ods层读取出来啊,然后经过我们的处理之后呢,诶给它写入到优惠券维度表的14号的分区当中,那OK,也就是这样的一个操作。
01:02
啊好,那第一天过去了,那我们看到了第二天之后,我们从ODI层能拿到什么样的数据。啊,你会发现啊,第二天我们拿到的仍然是全量的数据啊,因为优惠券相关的这些表啊,我们所采用的同步策略呢,诶也是每日全量啊,也是每日全量,那所以说第二天第三天第四天我们拿到的都是全量数据啊,那既然都是全量数据,那我们跟第一天的诶处理逻辑是不是就相同了呀?啊对吧?那所以说我们第二天要做的工作呢,就是从ods层读取15号这个分区的数据啊,然后呢,经过处理写到优惠券维度表15号的分区当中。啊,那同理,十六十七十八十九,那都是这样的一个操作啊,这个呢,就是呃,优惠券维度表,它每天的这个数据的大致的一个走向啊好,那接下来我们去看一下,那这张表的装载语句到底怎么去写啊,其实相对比较简单啊,那在这儿呢,我们就不再给大家去演示了啊,我们直接拿下文档当中现成的装载语句拿过来。
02:04
来放到笔记当中,大家看一下啊,那这个状态语句呢,其实非常简单,你会发现啊,我们往dim库喷印素这个优惠券维度表表当中导出据的时候呢,我们只从OD层的一张表里读取了数据,对吧?啊,因为这张表当中就已经包含了我们所需的所有的优惠券属性了啊,那所以说我们就不需要再去跟其他的表去做join操作了啊,这个相相对比较简单啊啊,那咱这儿做的一个具体的操作,其实就是从ods层啊当天的分区当中,呃,把我们所需的字段查出来,然后呢,Insert or right到in,那它这张表的十四二的分区当中。啊,其实比较简单啊,大家可能会觉得这里边儿,呃,我们的字段也没有发生变化呀,对吧,没有任何的处理逻辑对不对啊,虽然没有任何的处理逻辑,字段确实是没有发生变化,但是大家要注意一点啊,咱们的数据的存储格式发生了变化。
03:02
啊,啥意思呢,ODM层,那我们的数据存储格式是不是单纯的拉泽罗压缩文件呀,对吧?啊,那到了DM层呢,那我们的数据的存储格式是不是就变成了啊劣式存储加压缩的格式了呀,对吧?诶这个呢是大家需要去注意的一点啊好,那这就是DM库存素优惠券维度表的装载语句,那刚才我们也分析过了啊,那由于他每天同步的策略呢,都是全量同步,那所以说它首日的装载逻辑跟每日的装载逻辑呢是相同的啊,所以此处呢,我们看一个就可以了。
我来说两句