00:00
啊哎,这个退款实时表呢,我们也把它做了一个这种事物型,哎实时表啊,实实时表,所以是不是事物型时表呢,我们是不是也是采用这个增量同步啊,增量同步,那所以说本质上这种表,它还是什么表啊,还是。什么表还是增量表啊,增量表啊,所以增量表呢,就是首先保证它得是分区表,然后呢,每个分区当中存储当天新增的记录,对吧?那当然这个以他这个实时表这个为例,那这个所谓的当天新增的记录就是啥呀?就是今天新增的退款记录呗,是不是啊,每天的分区里存放了当天的退款记录,其实就是这么回事嘛,啊这个也不难,其实啊也不难啊,这是退款实时表啊,退款实时表行,那现在我们来看一下退款实时表啊,它一行数据应该指代的是什么,这是我们要考虑的一个问题嘛,啊,退款一行数据什么呀。最明细的一次退款记录呗,啊,我有一个用户退了一次款,我就在这张表里就得有一条记录才行啊,最明细的啊,好,那这个完之后再往下走,那考虑什么呀?考虑这张表当中的字段啊,字段还是呃,先从两个角度去考虑吧,一个是维度外键,一个呢是它的度量值啊,咱们把这个建表语句粘出来吧,啊粘出来之后呢,这个清楚一点啊。
01:19
放在这儿,呃,这个笔记呢,我后续呢,我会从今天开始吧,我会每天都给大家更新一份啊,啊就是把这个给家更新一下,大家自己去做这个出仓的时候呢,最好也有一个这样的笔记啊来,那这个是咱们的建门语句啊。加个小标题吧,大家看的时候比较方便啊下T面L语句,那这是哪张表啊,是这个,呃,退款表啊,CTRLC放在这CTRL位,好,那退款表的键盘数据咱们拿过来了,然后我们找一下它里边的这个维度外键啊,那退款这个事实跟哪些维度相关呢?首先第一个用户肯定是有的啊,时间肯定是有的,对不对呀,那还有什么呀?哎,对,商品肯定是有的啊,就是用户在什么时候推了什么商品啊,这就是咱们这几个哎,外键啊,几个外键,那其实你说这个东西它跟订单,它跟地区能不能关联上呢?
02:11
退款跟地区能不能关联上呢?能不能关联上啊,其实也应该有这层关系的啊,就是退款跟我们地区其实是从业务上是有逻辑关系的啊,这个你怎么看一下,咱们看一下啊来我们往下翻,往下翻。找到我们那个业务表啊。诶,你想一想啊,我们退款找到order refund ino对不对,那退款你想想是不是肯定跟订单有关系,咱得知道他是退的哪个订单里边的哪个商品,对吧?那那肯定找订单呗,我们就找订单,找到订单这个是欧点引后啊,那订单是不是肯定是跟地区是有关系的呀,所以说其实你这个退款跟地区也是有关系的啊,那这一块应不应该加上这个地区的ID呢?其实应该加上,其实应该加啊,但只不过咱这儿呢,呃,就是考虑到可能没有相关的统计的指标,所以就没有加上这个资本,但其实这个其实也违背了咱们这个建模的一个,呃,一个一个思想了啊,就咱建,因为剑门是在打基础嘛,哎,能关联上的尽量关联上,对吧,其实这块应该是有的啊,咱只是没有而已啊,应该是有啊行,大家就是记住这个原则就行了啊,就是能关联的尽量关联上啊好,那这是咱们刚才找的啊UID有了SKUID,咱们上面ID是有的,那时间ID是谁呀,是不是还是分区字段呀,地区分。
03:32
DT分区字段啊啊,那现在咱们找一下它的那个呃,度量值啊度量值,那度量值呢,其实在这儿呢,就俩,一个是refund的number refund number是不是就退款的件数啊,商品件数,那第二个呢,Refund amount退款的金额啊就是这些。啊,然后这里边还有一些其他的字段啊,比如说谁这个refund type。退款类型。那下边还有一个refund reason type,呃这这俩类,这俩字段大家应该能搞清楚,大家在购物的过程当中有有过退款的经历吗?退没退款,呃,退退款的时候你是不是会,呃有那什么退货呃,退款呃然后呢,还有什么呀?呃就是仅退款,因为他没有发货对吧?啊是不是有这样的呃,两种情况啊啊所以这是它所谓的退款类型啊啊那还有一种呢,是什么?是这个reason,那这个refund reason type退款原因类型,那退款原因类型有什么呀,什么我这个拍错了呃,什么那个质量问题啊,还有等等其他的一些原因,对吧?啊是这样的啊呃,对,七天无理由啊什么的,哎,就那些东西啊那你说这俩字段在这个表当中,他应该充当了什么样的角色呀?
04:41
退款的类型啊,退款原因的类型,这应该属于什么呀。也是维度字段吧,对不对啊,比如说我分析一下咱们不同不同的这个退款类型,那它所占的这个比例啊,或者就是说的专业点,就是退款类型分布啊,退款类型分布啊,就是这个类型啊,我占百分之多少啊,这个退款类型我占百分之多少对不对啊,那这是不是相当于是维度字段呀,这是维度啊,它俩都是维度字段,是这样的,这个东西咱们能搞清楚就可以了啊好,那接下来我们来看看这张实时表啊,我们来自于ODI层的哪张表?
05:15
人在哪张表,他应该。肯定是ODI层的那个orderfund info呗,对不对,那所以说咱们去找一下那张表啊,我们在这儿呢,SELECT1下去啊select啊,然后呢,From ods order refund info这个可以点过去啊,跟咱们idea当中,哎,咱们去B代码一样啊,Controlr点这个表名就过去了啊,然后拿到那来,拿出来之后呢,咱们可以把这个键盘语句呢,给它粘出来啊,CTRLC啊F3,然后怎么再回到我刚才那个位置呢?啊,当然我这个鼠标上有这个快捷键啊,我是可以直接回退,如果没有的话点谁啊,是不是这个按钮啊,对吧?呃,或者你按这个快捷键也行啊,我这个直接按鼠标就回去了啊,哎,这个比较方便啊好,那大家看这一下,这是order,这个refund in inform吧,咱们看一下这个主要数据来源就是这张表,那看一下他俩能不能对上啊。
06:06
好像是直接就能对上吧,对不对,两边字段一模一样,那所以说那这个也也就省的去照了啊,那如果说咱这里边给它加上那个province ID地区ID的话,那你说这边是不是直接再照一个order info是不是就行了呀?啊是这样的啊OK,那大家知道是哎,怎么去搞这个事就行了啊,怎么搞就行啊好,那这个搞定,呃,那它搞定之后呢,我们就往这里边导数据呗,啊来开始啊。压一个insert啊,Insert right啊,这个table dwd啊,然后呢,Fact order refund in for,后边呢,来个partan啊,这个DT等于哎,2020杠零六杠幺几114啊幺四啊,下边直接select,然后from这张表,这表呢,咱们要注意一点就是Y2DT啊,因为它是不是还是上下分区对应就可以了啊2020杠六六杠幺四啊,然后把我们所需的所有字段全部选过来啊就就OK了啊这就是咱们这张表的这个装载的circle口啊,比较简单啊,我直接拉过来吧啊,CTRLC。
07:10
替换CTRL位,好,就是这么去写这个词比较简单啊,也没什么可说的了啊,来,咱们来一个数据装载。好,这是这张表啊,这个视频也录一下吧。
我来说两句