00:00
好,接下来我们来看一下第三步呢,叫确认维度,那确认维度我们是干了什么事啊,来看一下确认维度。所谓的确定维度呢,哎,维度主要是描述,是这个描述业务的事实啊叫什么呢?谁什么地方啊核实,然后干了什么事,是是业务啊,只要没做那个动作,那个之前这些前面的这些描述信息都是维度。那举个例子,确定维度的原则是后续需求中是否分析到相关的维度指标,就是在你未来的这个需求分析的时候,如果用到了这个维度,那就一定要把这个维度体加过来,比如说我们需要统计什么时候。啊,这个是什么时间下的订单多,哪个地区下的订单多,哪个用户下的订单多。那你看吧,你分析一下,这里面涉及到几个维度。你说未来产品经理啊,给你出的这个需求指标包括了什么时间。
01:06
啊,什么地区哪个用户下去了,就是你关心哪些事情。那我们最终确定温度就是什么时间,那就时间维度,什么地点,地点维度,哪个用户用户维度。都要把它包含进来。对吧,得把它报进来,然后维度表呢,需要根度根据维度建模中新型模型进行维度退化,那这个啥含义啊,那我们来看一下啊,看一下我们这张表还是这张图。还这样?放大。好,这张图当中包含了大量的40表和维度表,也是23 23张表啊,几乎所有信息,那你抠掉对应的40表,把40表扣掉,这是对应的四时表。因为40表你干掉之后,剩下的不就是维维度表了吗。
02:00
那我们关心的是什么时间,什么地点啊,哪个用户,你看用户。这个肯定我们关心未来,我们要统计这个用户下了多少次单呢,评价了多少商品,对吧?哎,还有一个比较关心的就是什么地点,你说区域哪一个省份下单比较多,哪个省份支付的比较多,哎,这是有一块啊,还有呢就是优惠券。领用搞了这次活动,有多少人领用了相关的优惠券?又有多少人用这个优惠券进行了相关支付?那这个维度我们要未来要用,还有呢,这个活动啊,那这个活动呢,就是哪些商品参加了活动好吧,嗯,然后再往下,那你既然是一个电商,那肯定涉及到商品,哪个商品卖的好。是吧,那哪什么样的好,那这几个维度呢,是标准的维度,那其他的这些白的又是啥意思呢?为什么没把它放进来呢?你看优惠规则表啊,然后活动订单关联表啊,参与活动商品表品牌表PU3级分类,二级分类,一级分类。
03:06
那这些表有没有用呢?有用在真正的这个分析当中,比如说这个这个订单啊,订单详情当中用到了这个商品,哎,这个商品是哪个品牌的,我们需要跟他进行关联,哎,这个是PU是什么啊,它的是它是几级分类,我们也要关联,你说理论上来说,我这个订单详情,它的外围这个商品维度。我要关心这些信息。那么你关心这个信息,日后在统计的时候,我想拿到这些信息怎么办?我就得一张一张表去关联。假如说我就统计在订单详情当中,哪一个品牌的商品卖的最好。那怎么统计啊,你是不是得关联上他,然后他再交接上它。对吧,而且这个商品属于哪一个分类,你还得再再再再关联一个,你说在这种再关联。我统计这一个指标,我把这些表全关联上。
04:02
那咱们记住还记得星型模型的一个要求吗?星型模型的要求就是尽量在40表周围。只有。一级维度。那你这时间多少级维度了,这是一级二级三级四级对吧,这个是二级维度。那你这不严重违反了这个维度建模这个思啊,效率会非常低下,那怎么办?那我就提前把这些维度进行一个退化,退化到这里面对吧,哎,你这个维度上这个维度表退化是吧?啊,然后往这里面退。然后这个呢,也把它退进去啊,这是退到事实啊,这两张表是比较特殊啊,其实这是一张单维度,这个维度我没用啊。你把它退化为不就完了吗?包括这个省份和地区,你正常情况你要获取地区的信息,你得这两张表进行招引,那我们不想每一次计算的时候都招引,那就退呗。啊,就这么简单,好,那拿过来还是在这张矩阵图上啊,横轴上是表示这个维度啊,维度我们一般的维度呢,包括时间啊,什么时间什么地点。
05:10
地区,然后用户谁谁,然后什么商品对吧?啊什么商品,然后优惠券啊,优惠券是否参加了活动啊,活动后面有个编码啊,编码这个咱没用啊,不放这也行。对吧,我们比较关心的是这么几个,那这几个怎么来的,就是通过你刚才这张表。啊啊啊啊。选择过来,哎,就从这里面找啊,从里面找那其他的有同学把这都拿过来呗,哎,这些不着急,后面我们把它这些表呢,进行一个维度退化不就完了吗?退化到这一张维度表里面,想获取信息,直接从这里面找啊就完事。OK。这就是确定维度啊,确定维度啊,那你这个时间地区用户商品优惠券活动选完之后啊,别忘了哈,那这个呢,我们要跟这个40表之间进行一个关联,你左侧这是四词表业务这呢是维度表,那怎么关联呢?比如说时间加入购物车跟时间有没有关系,有没有关系。
06:16
是不是有关系啊。是吧,啊理解一下有没有关系出。你是不是关心未来,你要统计的这个指标里面是否包括什么时间?这个用户啊,把这个商品添加到购物车里面对吧?哎,这是我们关心的事儿啊,这是关心的事儿。那你看没有关系,未来我们就把它招集在一起,那这个至于有没有关系,怎么看呢?看这张图啊,把这个截下来。嗯。拍这张图。
07:00
盯上啊。哎,我们就给它定到这儿啊,这个缩小一点。啊。现在呢,我们加入购物车在这儿呢,对吧,加入购物车在这儿跟他相关的维度有哪些呢?哎,哪一个用户把它加入购物车,加入了哪一个商品。哦,那什么时间关不关心呢?关心我们这张表里面是不是没有时间啊啊,其实时间都关心啊,啊那就是什么时间什么地区,那这个地区他关不关系呢?啊,就是加入购物车跟地区有没有关系呢。地区数在这儿呢。加入购物车是在这儿呢?能不能能不能关联上呢?能关联上想办法,要想关联的话,你就得走哪啊嗯,你就得走,哎呀,这还真挺绕的哈,你得走到这个订单这啊,得这么绕这么绕。啊,这么绕,然后这么的能够连上。啊,这这么这么曲线一个招人一个啊,最终把它去连连接上,连接到一起,那这种呢,其实加入到购物车,我们不关心是哪个地区把它加入购物车对吧?啊,那所以说这个呢,我们就不打勾,呃,最后呢,是这个用户啊,用户有没有关系啊啊有关系对。
08:14
是吧,啊有关系,因为在这呢,能不能看清啊,啊稍微有点虚啊,我这有点虚啊,这个正常啊正常啊,然后之后商品对吧,哎,商品有没有关系,有结果。往里放,那优惠券有没有关系呢?加入购物车,你看优惠券在这儿呢,在这儿呢是吧,他们之间啊没有关系,跟活动有没有关系,活动在这儿啊,不用关心,OK,那下一个呢,是下单好下单我们关不关心什么时间,其实这个所有的下面这些动作啊,我们都关心。它是什么时间对它进行相关操作的啊,那就简单了,我都给他啊放上啊默认时间都有好吧,然后下面这个下单,下单在这儿,嗯,在这儿的话跟地区有没有关系呢?地区在这儿呢,对吧,那地区那有关系,那有关系就对勾呗,对勾。
09:04
用户那用户那肯定有关系了啊对。再来订单商品呢,商品,诶这个订单跟这个商品有没有关系。有没有关系啊,你就说在这呢,你这订单订单在这儿走一个订单详情,然后到了这个商品啊,这个呢,你想让它有关系,它就有关系,比如说我先招进他,招进他之后我要取出对应的这个商品,那说未来你想不想统计,呃,这个订单里面包含哪些。嗯,想想啊,这个需求呢,应该怎么出呢?跟商品相关的一个订单里面,他俩好像关系不是特别大啊,不是很大,日后产品经理跟你提这种需求的可能性不太大,产品经理跟你提的需求的可能性这个比较大。哎,说订单详情啊,里面哪一个商品卖的好对吧?啊,卖了多少件,那我直接可以从订单详情里面取,因为你这个订单啊,订单里面它包含多个商品,那你还得拆单,还得涉及到一些其他的,所以说不利于这个统计分析啊,就说这里面,那就是订单表跟商品暂时没关系,那跟这个优惠券呢,有没有关系啊订单表啊。
10:13
下单有关系吧,下单优惠券。对吧,我可以领个优惠券,然后这个比如说你支付的时候用不用这个优惠券是吧?啊那这个可以给咱有关系,对对勾上啊对。关联上,那跟活动有没有关系呢?其实跟这个活动啊啊也可以搞成关系,就说从这走吗,从这走。搞上关系呢,就是哎,我这个订单表有没有参加活动,你下的这个单,参加活动的订单有多少个。哎,可以这么统计哈,行对。OK,那再来这个下单明细四时表跟地区有没有关系?比如说它它跟上面这个地区有没有关系呢?哎,可以有关系啊,可以有关系,可以这么走啊,这么走绕过来啊,那这种呢,就是尽量的原则是什么呀?呃,尽量能勾得上是吧?啊这个这这个说的不太好啊,尽量能呢啊能关联的上,那你就把它关联上啊防止啥呀?呃,防止后面产品经理说我要统计相关指标的时候,你这个表呢,还没关联上,那你就需要后续的一个招引啊,会在招引上,好那来,那这个呢是订单详情地区,你可以把它关联上,那用户呢,那用户用户你也可以关联上,对吧,你看这么一个用户吗?这么也能给它关联上啊用户商品那就没得说了啊,肯定关联上优惠券,优惠券这个有点太远了啊,订单详情,订单详情里面只关心的是具体的某一款商品,这个可以不关联啊,活动的话呢,这也没有必要啊,想关联的话就是走订单啊,走这走这走这。
11:47
啊,这么走哈,那我们不关联了,嗯,绕的有点远,那领用优惠券呢,领用优惠券这个我们也不关联啊,领用优惠券跟地区时间没关系,地区,嗯,领用优惠券跟地区意义也不太大,那关联上吧,关联上也行啊,想关联上就可以关联上走这个订单啊,能把它拿到啊。
12:09
之后呢,是用户优惠券,跟用户,嗯,这个有关系。有关系,商品呢,跟商品的话没关系,你在这儿呢,对吧,你在这儿呀。好,你在这个位置,他在这呢啊,他这呢啊有点远有点远我就不连了,跟优惠券呢,优惠券呢直连,那这个肯定有关系啊。没有关系,跟活动呢,跟活动的话呢,你要想有关系,就是从这走这对吧,哎,这个这个活动跟优惠券啊,你这个活动是不是就是发优惠券啊,对吧?啊这个满满减打折呀啊等等你可以把它关联上啊这样去。还有一个是支付,那支付的话看一看支付表,支付表在这呢啊,支付表跟时间有关系,跟地区嗯,跟地区能关联上啊,可以关联上啊,可以把它关联上,跟用户呢,用户也能关联上。
13:11
再之后商品跟商品有点远,算了,跟优惠券呢,优惠券在这也折了两下,算了,跟活动呢,跟活动这么折啊,也不关联了,对吧?啊也不关联了,那下面这个退单,退单在这儿,那在这儿退单跟地区可以关联上折一下呢,你就给他勾上啊。跟用户呢,也是折一下给它勾上。哪个用户退的单跟商品那直接连直连。商品是直连,跟这个优惠券呢,优惠券隔了两下不连了,跟活动呢,也是隔了两下不连了,跟评价,评价的话,评价在这呢啊,评价在这,评价跟这个用户和商品这是直连的哈,跟地区呢,跟地区你就得这么走一下了啊,走一下也还好,那也可以哈,嗯,哪个地区的评价比较多,这种也行吧,加上然后跟用户关联上,跟商品关联上,跟优惠券没关系,跟活动没关系。
14:12
收藏收藏在这儿,在这儿的话跟用户有关系,跟商品有关系。地区呢,地区的话你走的有点远啊,跟用户用户关联上,跟商品关联上,嗯。跟优惠券没有连,嗯,跟活动不连了差不多,这样来看一看啥问题。支付和商品连上是吧,我看看支付和商品。支付商品。支付了哪个商品啊,这个可怜可不连啊,这个是可怜可不连,嗯,退款某个商品,判断各支付风险方式退多少啊,你看一下支付表你就知道了哈,来大家看一下这个支付表在这儿呢,黑面的印对吧?哎,这是支付信息,支付信息里面呢,它存在的是一个auto ID,用户ID对吧?然后这个是支付的总金额,他说直接面向的是订单啊,你这个支付的这个订单里面是不是有可能包含多个商品。
15:09
对吧,哎,包含的是所有商品,然后再往后走。你看没了啊,这就没了,那你从这张图上你看到的这个效果就是什么呢?哎,这是支付支付这里面是针对这个订单啊,定金单的总金额进行了一个支付,那至于这个订单里面又包含多少个子商品。他这目前是看不到的啊,他能能够连上这个商品啊,能连不是说不能连啊,他是能连一下订单详情,然后再连一下这个商品表,现在是连了两下是吧?哎,连两下然后才能把它连接上啊,那这个呢就是可连可不连啊,理论上来说这个连线在一起的都能把它关联在一起,那这个关联的原则是你就分析一下后续会不会有产品经理统计相关指标。啊,如果需要的话,那就把它连上,不需要那就不连啊,这个要知道一下啊,啊每个人的连法也不太一样啊,这个呢就看能不能满足需求,仁者见仁,智者见智,那最好的就是跟它相关联的第一级维度,那你必须得连。
16:08
是吧,比如说你加入购物车的用户,加入购物车这个商品,那这必须得连,那至于这个用户再跟什么订单详情,再跟什么省会,这个要不要连,那就再说啊,这个要再说啊,另当别论,能懂吗?这个原则啊,这是这个确定维度的一个原则啊,原则。OK吧,还有啥问题看看。没问题的话扣个一,有问题扣二。这是确定维度啊,确定维度呢,仍然是这个,呃,选择一些名词对吧?啊,然后呢,是维度建模这块呢,是采用这个新型模型,尽量让这个实时表周围啊,采用的是这个一级维度啊,进行一个退化啊。现在百度。
我来说两句