00:00
好,我们稍微回顾一下啊,回顾一下odsdw ddwsd wt以及ADS分别都做了哪些事啊,做哪些事?首先第一个ods,那你要看ods有哪些,它的数据长什么样啊,Ods的数据呢,是按天进行存储的,存储完之后里面都是压拉住了压缩的数据,那就导致我们这里面在处理的时候啊,只做三件事啊,第一件事呢,叫保持数据原貌,不做任何修改,哎,防止你后面其他层算错的话,我这里面起到一个备份的作用,第二件事这里面你是压缩的文件,所以说创建表的时候,我们要支持对应的压缩,那再有你这里面呢,是按天进行导入过来的数据,那我后续呢,就要建对应的分区表啊,一天一个分区,防止后续的一个全表扫描ODI成。接下来我们来到了DWDDWD呢,这里面经过了标准的四步。叫选择业务过程,生命力度确定维度确定事实,那第一个选择业务过程,选择业务过程是你选择感兴趣的业务过程。
01:06
啊,什么叫感兴趣的,哎,就是我未来这个要统计分析啊,涉及到相关的一些需求要用到,那我就把它选择过来,中小型公司直接全部都选择,因为一共表啊,啊这个50张以内吧,啊50张以内的表直接全拿过来,要100张那就要看了啊,要看OK,那像大公司呢,一般1000多张,那我们就选择自己要统计的业务线。就够了啊OK,这是这块选择业务过程,那下一步呢叫声明力度,那声明力度那这里面什么力度呢?就记住选择最小力度,什么叫选择最小力度,你只要不对它进行聚额操作就可以,那它传过来的数据是什么力度,那就什么力度就不要管下来是确定对应的维度,那维度通常包含的就是时间呢啊地点呢,对吧?啊时间地点,然后人物啊,商品活动优惠券啊等等一些名词啊,把它找出来,找出来之后还要这个把跟这个维度相关的一些表进行一个退换。
02:10
啊,退化遵循的原则呢,就是维度建模当中的星型模型。OK,最后一步叫确定事实,那所谓的确定事实呢,其实是确定每张事实表的度量值,哎,确定事实表的度量值。那度良哲就上这个表里面去找,找这个字段,它能不能累加,就判断它能不能累加。对吧,哎,如果能够加在一起,那它就是对应的度量值,那度量值呢,通常有这么几种,叫次数,个数,件数,金额啊,比较常用的那金额里面,你看包括总金额,原价金额,什么优惠金额,什么运费金额。对吧?哎,这是一个大项啊,大象,OK,好,这就是标准的事部建完了,建完之后最终呈现的效果是长这样。
03:01
哎,长这样。看看这张图长成什么样呢?哎,外围呢,放上对应的事实表,把你的业务过程选择出来了。对吧,然后中间放的是对应的维度表,那这个维度呢,是已经进行维度退化之后的啊,这里面比较典型的将商品相关的维度退化,将地区相关的维度进行退化。诶退化在一起了对吧,那你看这个40表周围,它是不是就一级维度啊,你再这么多就是一级维度,它不会说关联你这个,呃省份,然后还要关联地区,不需要二次招引,那它就是新型模型嘛,这不就建完了吗?按照新型模型建的。好,大家来,来到了这个DWS和DWTDWS呢是按照每天的行为进行一个统计集合。那这道T呢,是按照一个主题的,从事件开始发生,一直到最后这一次,那这个整个这个时间的累积行为,好,那这里面的这个表怎么来,比如说DWSDW表怎么来的,都来源于你上一层DW当中所有相关的维。
04:10
时间维度,地域维度,商品维度,优惠券维度啊,还有活动维度,用户维度。把它们作为哎,这个观察事物的一个角度,好,那找到这些维度之后干什么呢?站在维度的角度。找到跟这个维度相关的所有事时表全部找到,找到跟它相关的事实表之后要定义字段,定义的字段怎么定义?就取它四值表当中的度量值对吧?哎,下单次数下单金额支付次数支付金额加入购车次数加购车金额,把它的度量值直接往这一放就完事,这就是DWSDWT呢,比这个略微要复杂一点点。DWT仍然也是站在维度角度去看待事实,只不过这里面这个字段是看待事实表当中它这个开始和结束,以及它从开始到结束的累积过程和最近一段时间的累积过程的值。
05:12
那就完了嘛,那首次下单时间末式下单啊,累计下单的次数,累计最近30下单次数,那还有多个度量值,那另一个度量值的就是金额,那就是累计下单金额啊,累计下单最近三十日的金额。是吧?好,那最后一层adi层,Adi层呢叫报表啊,直接分析报表就行了啊,直接你从这个前三层当中去取数啊,最细力度的你去从DWD去取,宽点尔力度每天的指标呢,从DWS啊,最初的啊,这个累积的从DWT直接去取。那分这个层的好处呢,就是哎,减少了重复开发的过程对吧?哎,而且呢,避免了这种非常复杂的业务逻辑,直接简单的取数就行了,你看你这个数据如果都已经给你分析成这样了,是吧?首次下单模式下单累计下单次数,累计下单金额,这个其实直接就可以作为adi成的指标了,一个聚合就完事了啊,或者一个驱重啊就差不多,所以ADS层指标是最容易的,这就是整个这五层啊,希望大家呢啊能有点体会啊,先有印象对吧?啊先有印象后面呢我们结合。
我来说两句