温馨提示:文本由机器自动转译,部分词句存在误差,以视频为准
00:00
好,我们看最后一个需求啊,活动统计啊,实际上这个活动统计与刚才我们做的优惠券统计的需求十分相似啊,来我们看一下它具体要求是什么啊,来,那该需求要求我们统计最近三十日发布的所有活动的参与情况和补贴率啊,那当然这个补贴率呢,指的仍然是优惠金额与参与活动的订单原价金额的比值,好,那我们接下来看一下建表语义当中的具体字段啊来一起看一下第一个字段DT统计日期不用多说,然后下一个活动ID啊,再往下呢,活动名称,再往下呢是活动的开始日期啊好,那这些呢,同样还是维度字段,对吧?来我们继续往下看啊,那下面的就是一些统计值了,这里边包括参与活动订单数啊,还有什么呀,还有参与活动订单的原始金额啊,参与活动订单的最终金额,那下面呢是优惠金额,最后一个呢是补贴率啊OK,那这就是活动统计这个需求的说明啊,由于这个需求的实现思路与刚才的优惠券统计完全相同啊,所以在这儿我们就不再演示circle课的编写了啊,我们直接看一下文档当中的最终结果,来先看一下这个S尔克的整体结构,来我们往下翻啊呃,这儿呢有一个子查询对吧?那下面呢也有一个子查询啊,这两个子查询呢,做了一个关联对不对?那完事之后呢,诶,他又从里边选择了几个字段对吧?这其实就是最终的结果了啊,然后呢,再使用insert把数据插入到ADS层的,诶活动统计表当中啊,这就是这个server的整体结构啊,那现在呢,我们看一下具体的内容啊,现看第一个子查询啊,第一个子查询呢,是不是从蒂姆activity弱in份也就是。
01:41
活动维度表当中获取了我们所需的维度信息啊,一个是活动ID,一个是活动名称,还有一个呢,是活动的发布日期,然后有一个小细节大家需要去注意一下啊,就是活动维度表当中每行数据指代的是什么?是一个活动当中的一条规则,没错吧?啊,那所以在这儿呢,我们去获取活动的这些基本信息的时候呢,需要记得去重啊,那在这儿呢,这个分组就是为了去重啊,大家要注意一下啊,OK,我们继续往下看啊,看第二个子查询啊,第二子查询呢,是从DWT层的活动主题表当中去获取这些统计值,没错吧?哎,当然这里边也要注意一下啊,活动主题表当中啊,每行数据指代的也是一个活动当中的一条规则,没错吧?啊,那现在呢,我们要统计的是什么?是每个活动的累计值,那所以说这儿是不是需要进行一个聚合呀,没错吧,而且得分组,聚合按什么分组呢?就按照活动ID进行分组啊,那这样一来呢,是不是会把同一个活动的每条规则。
02:41
的统计值汇总到一组啊,对吧?那之后呢,再使用萨姆求和就可以了啊OK,那这就是我们的第二一个自查群啊好,那这两部分数据都查了之后呢,诶,做一个关联就行了啊,关联上之后别忘了过滤啊,因为在这儿呢,我们要统计的也是最近30天发布的活动啊,那照上之后呢,就可以选择最终的结果了,没错吧,那都选完之后呢,再把数据insert到ADS层的activity space这张表就可以了,好,那这就是活动统计这个需求的全部内容。
我来说两句