00:00
好,接下来呢,我们再来看一下这个支付誓实表它又是怎么做的哈,怎么做的,那首先孩子看啊,孩子看我们之前分析的这个啊,这个数上建模啊,上建模之前我们分析的时候说这个支付里面跟时间维度相关,跟地区维度相关,对吧?然后呢,还有对应的这个度量值金额啊这些,那行,那来看一下来看一下啊。嗯,下面我取出这个支付表,事实表的一个建表语句。建表里面呢,有这个ID啊,有对外业务编号,订单编号,用户编号,支付宝支付宝这个流水编号,你发现这里面哈,都是连接的各种外界。对吧,各种什么什么编号嘛,那编号的话你就得去外部去去取啊,都是外建,要理解这个这个含义哈,你说日后如果面试官问到你们的试试表是怎么建的,那这里面就是外键加度量值。外建加度量值这句话要记住,这是你数仓建模的核心啊,四实表怎么选呢?之后呢,这里面有对应的一个金额,金额呢就属于度量值啊,度量值交易内容,交易类型,支付时间。
01:12
是不是,然后呢,这里面有个省份ID,为什么有个省份ID呢。因为你这里面在建模的时候,想统计跟地区相关的支付信息。你说哪个地区支付的信息多,那所以有地区,但是很遗憾,之前我们这个支付表里面,它是没有这个地区ID的,也就说没有这个省份。同样的也跟我们上传表是一样的,你需要进行一个关联操作,获取到这个什么ID,那你看吧哈,还是看这个地图。这是支付表在这放着呢,我想获取的是省份ID信息,那您怎么走能获取到它,哎,所以说这个支付表信息,你仍然是要关联这个订单表之后拿到你对应的省份信息啊,所以说这张图啊,啊就很重要啊,从这一拿哎,就把它拿到了,行,那这是这块啊,那么来看吧,还是把这个目标表准备好。
02:09
老套啊老套。目标表往这一贴啊,那用到的是pay门的印缝,你肯定要把ods的胚门的印缝拿过来,因为这里面会这里面有大量的信息在ods层对吧,OD层的信息。找找ods。ODS1缝这。找到它,把这拿过来。回来之后往这一放好,那这张表你看一下能不能把这些所有信息都覆盖呢?哎,看点点点。诶,这是一个支付金额啊,支付金额是跟这个头头棒的啊,这块该改名字了啊。啊,这个只是一个事儿啊,Submit type time a后面只有到了这个省份ID的时候不行,那省份ID刚才我们也分析了,你说你可以关联他的订单表就能拿到这个省份信息。
03:10
那订单表拿过来,他。哎,把这个拿过来。好,也就是说这个目标输出表和我们准备的这个数据输入表都已经准备就位,那准备就位之后,下面开始继续继续老套对吧?啊,同样的这个流程,同样的操作,来吧,再来一遍啊,多写一。产生这种条件反射啊,后面就好了哈,后边122题,比如说找工作呀,这个包括这个干活都很容易,你只要拿摸索到这个规律之后,剩下的事都简单哈,向里面插入,插入之后条件反射找是不是分区,哎。对吧?嗯,条件反射式的固定套路,嗯,2020杠零三杠幺零啊准备好之后,下面套路我相信大家应该都知道了吧,啊还是from下来上来先把这些给我搞定纸查询,只要两张表关联,那就把这个指查询往这一放啊噪音哎噪音放,然后放条件对吧?那剩下的就是往里填吧,就是填空啊,属于填空题了哈啊,那第一张表啊,第一张表呢,在这呢,拿过来。
04:35
Select行啊,明明是这个需要烧脑的分析题啊,明被变成了这个填空题,你看搞定搞定之后还是要看啊,查询的时候一定要过,你要一定要看,每次查询的时候你就看一下它是不是分析表啊,要不要这个进行一个过滤啊。条件。
05:02
外条件DD有没有人想过这件事啊,说这个我先招人,招人完之后在后面这块过滤啊,有没有这样这样的想法。啊,有没有想过就是这个我不在这过滤,我在这后面啊,类似这样的。那样不行啊呃,之前呢,京东就出过一道题,他那道题呢,就是上来先两张表进行招引,招引完之后呢,进行一个过滤。啊,问你这个代码怎么进行优化啊,怎么进行优化,对性能很差啊,你看建峰说对啊,没毛病,对,那肯定的效率没有那么高,为什么呢?因为你先招人了,那先招人的话,那数据量很大呀,有一些没必要的数据,比如说你这是我要招人的,是3月10号的数据,如果你先招人的话,我3月11号的,3月12号的,甚至3月13号的都有可能招应进去了,然后之后呢,你再把它过滤掉,那这个那就太差了啊,太差之前呢,是京东啊,有过这么一道题哈,就给你个社口让你就优化,所以说很简单啊,想去京东的话太容易了。
06:08
行,那这是第一块啊,把这个配面的液块这里面的数据过滤出来,那接下来呢,是过滤这里的。过滤这里的。Select哎,由于这里面字段比较多啊,而且我用的呢,只用到其中的两个字段就行,一个是ID,一个是provi ID,那这两个呢,我就直接哎获取,采用这种方式呢,效率是比较高的。顺着过来,哈,行,From from,这张表拿过来,然后where,条件。呃,DD等于2020杠零三杠幺零好,那给两张表呢,都要起名字啊起名字那这个呢是PI对吧?老套路PI,那下面这张表呢,OI。
07:02
O。搞定进行关联,关联的时候啊,确实要要仔细的去瞅一眼啊,这个别着急,那首先去找吧,这个他这里面有没有订单ID,哎,一看有一个订单ID。那他的订单ID就跟这里面的ID是一个的啊一的跟。啊,绑定在一起来吧,那这个呢是派点好等于下面的是OI点。ID。哎,这样呢,就愉快的关联在一起了哈,关联在一起之后,那剩下的事就是往这里面去补齐对应的字段,那补齐字段呢,先拿哪一个多就拿从哪一个里拿哈,哪一张表得多,那这张表得多我就取它啊。从这里面尽量。派点ID再往下。好。好看点,然后呢是order ID没问题。
08:07
第二下一个应该是ID没问题,快,第二。这呢是啊,支付编号在这个过程当中啊,你要体会啊,这里面这些字段是怎么来的啊,这里面字段呢,是这个呃,外键加上。这个啊这个呃,这块要注意啊,这块要注意了啊,看现在呢,你的目标表呢,这块呢叫支付金额,但是呢,由于下面这块变成了是tall滔amount,其实是一个事儿,只不过呢字段名称不一样,那你取谁的?哎,得取下边这个哈,你说按照这个位置,它这个值未来会附到这里面去啊,放到这里面去啊,其实这块这个改名字确实不是特别好。之前呢,我也尝试改了,我是尝试着把这个payment amount改成这个total amount啊,但是改完之后啊,啊,由于这个后面这几层后面还有这个DWSDWT以及ADS,那其他老师呢,这个他们都用的是这个payment灯棒。
09:11
所以说那个改起来啊,这个工作量确实比较大啊,而且容易这个改错,所以说暂时呢,嗯,这期班呢,我就先你既然改名了,那就改名字吧,啊那那我这块呢,只是说在这块。通复制它的时候稍微不爽一下,如果我要把这块呢,也我我也给它改成这个配平棒啊,不是给它改,我要如果是这样去改。怎么改呢?我这块应该命名的时候应该这样。正常应该是这样去命名。啊,如果改成这样的话,那我后面的表天天都改,所以就麻烦一些啊,图一个省事啊派点。Subject。之后。这是payment type类型。再往后。Time。
10:01
嗯,再往下呢,是审核ID,哎,审核ID呢,这里面找不到了,那就往下一张表去找oy点。嗯,省份吧。好,省份信息我们也填齐了,填齐之后看还有没有其他字段,嗯,没有了哈,没有了,OK这块那个逗号一定要注意行,那这个呢也OK了,OK之后呢,我们来运行试一下啊试一下。这个表我见了,没见吧,见下表。来到DWD层,嗯。这。支付这张表,把它拿过来。哎呀。好,然后呢,像这里面插入对应的数据。
11:01
OK,争取一遍成啊。行,那我这个写完了之后呢,查一下,哎呀,直接复制过来查一下得了。没有。看有没有数据啊。哎,能看到啊,这里面就有这个3月10号对应的这个数据啊,就说明呢,目前这个是没有任何问题的,对吧?啊也就是说这个支付。支付事实表。
我来说两句