00:00
刚才呢,这四张表我们都已经获取了,而且并测试了一下都没有问题对吧?呃,那这个呢,是生长文件当中写法,我们呢,要稍微的做一点调整,做一个修改啊,所以我专门录一个视频,专门说这个事啊呃,原因在于什么呢?我给大家看一下啊,在这。咱们呢,有一个造数据的脚本,大家还知道吧。Dblo。好,来看啊,Cat。这里边儿呢,有一个这样的参数。是不是需要重置的一个问题?重置是什么意思呢?就是说我们如果是一就要重置对吧,就要把这张表实时表呢给它删了,重新往里面去添加数据。对吧,啊,那他说你第一次置为一,后面呢都是零就不重置了呗,对吧,那你要注意啊,如果你不重置,因为毕竟我们实时啊,呃,虚拟机去测的对吧,你不像离线啊,你要是不重置。
01:03
你数据量会越来越多。对吧,你书上越来越多了,你每次造数据的时间就特别长。然后呢,你要等很久,所以呢,在实时测试里边,我这个地方呢,就是一不改。啊,就让他一直是一不改。同意吧,好,就算你第一次是一,那么你追为一的时候,这张表,这些个表是不是都有这个删除操作呀。对吧,我们刚才是不是分析了在生产环境当中,像这些表呢,它其实没有删除操作,对吧,但是呢,咱们这个地方实际上有删除操作。对吧,那为了把这个删除这些东西呢,过滤掉,所以呢,给所有的这个四张表啊,我们再加一个过滤条件,能懂吧,啊就是因为这个事儿我们在咱们需求当中需要做一下,但是你在生产环境当中其实不做,所以我单独的开一个视频跟大家去聊这个事儿,OK吧,这个地方呢,音色的。
02:04
你加个银色的对吧,好,那对于我们第二张表而言,订单表它可不光是银色的对吧,诶这边呢。括起来。或者。等于update的对吧,反正d delete的我不要啊,因为生产环境当中其实没有低力的,但是你生产环境当中跟这种把这个加上其实也可以。大家想是不是你把它加上,其实也可以。对吧,因为你加这个过滤,它总不会出错了,对吧,好。那这边也加一个。银色的对吧,好,这边呢,我们也加一个银色的。啊,都加一个这个数据啊,就delete呢,就不要就这意思啊好吧,呃,那样呢,我把这个添加进去啊,这个拿过来。第一章明细表。
03:01
明细表在这对吧,嗯,加个空格啊,加空格回车。往这儿放。好吧,这一定要加空格,你要不加空格,这个跟这个。啊,这这有一个单引号也还行对吧,如果没有单引号,你最好有个空格对吧,最好有个空格啊,不容易出错啊,这个呢,我也加一个啊,再把刚才我们加的这个东西拿过来就是它。对吧,放在这啊,这加空格啊加空格啊好,那这边呢,加个空格回车啊,这是最后两个都一样啊,最后两个都是银色的,对吧,把那个拿过来。往那一放对吧,那下面呢也一样,你直接写了。空格回车往那一放,对吧,我们过滤一个类型,这个能明白吧,对吧,我就专门开个视频给大家去补充一下,诶,呃,我突然想起来了,既然这个这样写,好像前面有个东西我们写的不太严谨。对吧,这个东西好像写的不太严谨。
04:02
这个东西写的有问题吧,我看一下啊。咱们应该怎么样?咱们应该把。这个。括起来吧,对吧,应该这样写。啊,这个还是括起来的没问题啊,然后呢,在这得再加一个括号对吧,再到这儿再加一个括号啊,就是应该是什么,应该是这个音色的跟它跟这个后面是一个或者的关系,对吧,而这个与这个条件呢,跟他们之间都是。同时满足的关系。对吧,就是说。库名a and。B对吧,然后呢,And类型吧,类型呢有两种,嗯,可以是银色的或者是。Update这两种,但update呢,这种里边又有复杂的结构,对吧,所以呢,我们应该把这个in色跟update括起来,把它用or连接啊,要不然的话就不对了。
05:04
对吧,咱们应该改成那样。这个加了括号,这也加了括号,这就对了啊对对了对吧,好呃,那咱们呢,就处理完了,就是得这样处理一下,这个能理解吗?大家就是因为咱们造数据的过程当中会产生这种激励的数据。能懂吧,那生产文件当中他确实没有什么删除操作,但是咱们在造数据的时候,到时候造数据的时候是有这个d delete的数据的,对吧,所以呢,我们就把这个D类数据过滤掉,相当于我们就不要。对吧,我就把这个电力的数据过滤掉,我就不要这个数据,对吧?啊,省得你搞一堆nu在里边,但其实也没有什么大问题啊,你的数据里边呢,就会有大量的nu值,你知道吧,因为你定delete的数据呢,它这个data塔呢是为nu。大量的值对吧,没有什么意义这个东西啊。接下来我们要做的事情呢,就是说把这个五张表关联起来啊,那table因为点query。
06:01
对吧,还是把这个东西写好,然后接下来呢,我们来写这个内容好,嗯,在这边呢,Select的啊,我们先把大的架子给它写起来,哎,字段的先不写from。啊,哪张表呢?咱们有这几张表啊,首先我从这拿,因为咱们这儿呢,都取了一个名字了,叫all the detail table,这个呢,咱们叫all。D表好detail对吧,然后呢,我们很明显join join谁。专业,咱们第二张表叫order。For table对吧,这个呢,咱们叫OI表。啊,这个是doing对吧?啊,那on。字段我们来找一找,哎,他们关联字段肯定订单ID吧,对吧,用订单ID去关联,那么对于这张表而言呢,它是ID。对吧,它是ID。啊不对,他他是订单明细表,它订单明细表呢,应该用的是all ID对吧,用的all ID,那这张表呢,本身就订单表ID呢,就all ID对吧?所以呢,对于第一张表我们用的是什么od.o的ID跟o i.ID。
07:12
进行关联对吧,再加来写left join。啊,咱们level状语谁呢?第三张表对吧,第三张表呢,叫order activity table。Activity。对吧,往这一放,那接下来呢,啊,我们要写这个字段了,那我们数据应该用哪个呢?你看啊,这边他自己的ID,还有个T的ID,对吧,这个他这个微标识啊呃,All的ID all detail ID。这活动ID啊,当然这个是一个主见对吧,至于是自增啊,或者什么都可以啊呃,Idea这是规则的ID对吧,这是用于关联那个为表的啊,商品SKYD对吧?嗯,创建时间。那。我们想一下。
08:02
我们应该用谁关联呢?对吧?我们共有的字段有all ID,有all detail ID,那你觉得我们应该用哪个字段进行关联?你觉得我们应该用哪个字段进行关联?大家告诉我。是用all ID还是detail ID?应该用哪一个,这两个挑哪一个,对吧,我们共有的质量应该就是它的。啊,云总说用detail,其他同学呢,什么看法?啊,方总也说了,All the detail。Detail,对,其实用all detail ID啊,用这个啊用这个ID对吧?好,那这个呢,拿过来啊呃,在这边OD还是OD的谁啊,好,那我们这个先写上啊呃,这张表呢,我们叫OA表可以吧,叫OA表O的activity嘛,我们就简写啊,那OA的呢,我们再粘过来一张表啊,那OA表呢,还是。
09:04
Already。对吧,还是all这样写一下,好,那继续let join啊。继续来join,咱们呢,再来一个,什么叫order。Car。啊,对,这个是ID。啊,这个是ID,对,我们要用的是detail ID对吧,这是OD表,这是OD表,然后detail ID啊好,那这边呢是OC表。对吧,OC表啊,那同理啊,OC表里边呢,它有凹的ID。All the detail ID看见没那一样的,是不是也用它呀?对吧,啊,也用它就好了啊,那这个呢,我们最好加一个边名啊,诶这个怎么漏了别名了。对吧,那你又没有别名,那到下游你要处理的时候,有时候就不太好处理了,对吧,你都加一下。
10:05
这个我就不用那个什么。批量了,直接这样写一下啊。没有问题吧,都加了空格哈。IDID啊,那我们还是用它吧,对吧,那就很简单,我们就直接把这个拿过来哈。拿过来,然后呢,这个改成OC表。改成OC表对吧?好,那最后呢,咱们还差一个继续join谁。Join,咱们的base dic这张表啊,咱们的。这张表,哎,他名字呢,叫贝斯DC啊,好,拿过来。教他这个呢,我们就取别名叫dic啊。好,那关键问题在于,我们希望哪些字段?去做处理对吧,我们才需要改啊,那比如说按照我们这个逻辑啊,来给大家看一下,这边其实有哈,这边其实有我们要什么呢。
11:01
这张表我们要获取订单来源类型名称啊,就是订单的来源,那来源是什么东西呢?来看啊,我们在订单明细表当中有一个这个source,看见没。来源。对吧,有这个东西啊,那这个东西呢,对应的就是订单,你是怎么来下的这个订单,对吧,从那个购物车就有加购的时候。推广渠道相当于对吧,啊去关联,那我们用source type。对吧,那还有一个点在于你希不希望这个东西all states对吧,1001234这个东西来看啊,配CC100几对吧。这个。诶,那我们把这个改回去啊,这是我们之前改的对吧,这个不太合适啊,啊未支付已支付已取消,已完成退款中对吧?退款完成啊,你要不要改这个,如果说两个都要改,那你就关联两次就好了。对吧,如果说呢,你只关心订单明细当中来源,对于订单里边。
12:04
对于订单当中的这个all states,你不关心?那你就关联一次。能懂吧?啊,你就关联一次就好了啊,当然你都可以啊,假如说我们两个都要,两个都要对吧,那我先呢拿着。呃,两个都要还不好做,因为咱们的DT字段呢,我只保留了一个,那我就保留一个吧,好吧,因为DT字段就是不是DT啊,就PT字段。我只留了一个对吧,如果你要两张表都要的out in for里边也得添加一个这个PT我就不回去添加了,不改前面了啊,那我就只改这个,只关联被CC用all the detail的source去关联。可以吧,啊,用这个关联basedc这张表啊,所以呢,咱们这边就有了,哎这个地方呢,用OD点哪个字段叫source type。对吧,往上翻啊,我们要尽量来粘啊,不要写错了对吧?呃,用source type用它吧,好把它拿过来。
13:04
往里放啊,然后跟谁呢,跟dic表。啊,跟D表去关联,跟它的什么呢。Diic code的对吧,这张表呢,一样的,如果是拿不准,咱们呢,到这边来看一眼,叫什么叫dic code的对吧?啊跟dic code的进行关联,好,那看上去基本上我们关联写完了,但是注意这个地方。是不是还要处理一下,不能这样写。不能这样写对吧,得加上处理时间啊,处理时间呢,我前面有啊,我就直接拿一下了。这个。看拿过来往下拖对吧,哎,拖到这。放在这个位置对吧,当然这个TPT不对啊,咱们是OD的表,All detail表,注意啊,所以之前我们在处理all detail的数据,是不是把这个PT。
14:02
就他保留的呀。对吧,就是为了关联我们的被D表用的,那如果说你这边想他也关联把这个字段改了,对吧,这里边呢,它们有一个all states这个字段嘛,对吧,你要想把它改了,诶也对应的把那个。具体的名称拿过来,那你这也放一个PT,然后再去干什么,Join一次被CC,然后用oi.pt。oi.pt然后呢,这个写OI的。All states。去关联dic的,Dic扣的没毛病吧,好,那这是我们的关联,我们就写完了,接下来呢,处理字段。字段呢,咱们这样,咱们呢先不用管对吧,然后呢,我把四张表的字段。先都拿过来。对吧,然后接下来肯定要考虑去虫啊,那咱们这样。呃,首先。订单明细。
15:05
好,这是订单明细表,往那一放。可以吧,好,那中间加一个空行啊,加空行我们加以区分啊,呃,那么第二个这是订单明细表,这是订单表啊。订单表在这ctrl out加shift对吧,然后呢,往下一拖。拖到这,当然中间还有个type跟old,我们也要拿过来对吧,Ctrl shift CR c啊呃,然后呢,把这个放在这儿也加一个空行,当然呢,这我们得写两个东西,一个old啊,一个type对吧?Type呢,一直要保留到最后一个类型啊,还有一个old对吧。后啊,这个字段比较特殊了,属于特殊字段,或者我们放在最后也可以啊,放最后,因为等会呢,有些字段我们要统一处理啊,这两个字段呢,比较特殊,放到最后我们单独处理啊。好,那接下来第三张表,我们的。
16:00
活动对吧,啊先你不管怎么样啊。我们呢,就简单一点,我先把它拿过来,我就不用一个一个对对吧,等会儿呢,我们整体来对就好了,好,那还差一个。勾线。好,那这个搞定。啊,这个搞定了,搞定之后呢,我们先把对应的。这个先写好啊,怎么写呢,CTRL加shift对吧。哎。这个呢,来自于我们的O。地表是不是好detail第一块嘛?哎,不对,这个还粘错了这个啊,这个字段有点多哈。瞬间就多起来,这个OD表达OD点啊,那我们把这个对应的先写上啊,到时候呢,我们再整体去改啊,看有的东西重复了,我们就要改掉好吧。这个是oioi等123空格啊OI点对吧,好,这个是OA表吧。
17:10
OA点好,那这个呢是OC表。OC。点对吧,这个呢来自于OI,这两个呢都来自于oy对吧Y啊。这是Allin for这张表里边的。啊,那咱们呢,这个放在最后啊,放在最后,因为呢,它这两个字段比较特殊啊,比较特殊,肯定不会跟人家重复啊,而且呢,它这个东西还是关键字啊,有可能是关键字,所以呢,咱们得这样写一下,对吧,放到最后啊,咱们知道它是OI表就行了,好,那接下来呢,我们就处理重复字段,这里面字段重复的可多啊,首先呢,All the detail我就全部保留,可以吧,All the detail全部保留。呃,那这个字段有没有用。注意,这个是all in for,表all in for的ID是不是all all ID啊?
18:01
对吧,那没用。干掉,因为奥利这儿已经有了。这是不是已经有了对吧?这是detail ID,这是all ID对吧?好干掉,呃,接下来这个什么联系人总金额,总金额可以对吧?总金额可以啊呃,因为这里边是什么split total帽,这是七分之后的金额。他切分后的金额对吧,这是总金额啊没毛病对吧?呃,用户ID支付方式这些东西呢,都可以保留吧,啊反正我我也拿不准对吧,假如说跟大家一样,诶拿不准在公司当中拿不准,拿不准怎么办呢?都都保留着呗。对吧,就都保留着啊,那这个是减免的金额,那好像这里边儿没有什么东西可以不要了,对吧,都拿过来,因为它里边有一个什么图片呢,我们已经干掉了。好,这个ID,这个ID注意啊,是订单。关联。活动的ID。对吧,那你想保留也可以,但是你不能叫这个名字了,因为已经有一个字段叫ED了,你要叫他那不行,对吧,你得取个别名,取什么呢?比如说我们取一个叫order。
19:11
Detail。Activity。能懂什么意思吧?对吧,这个一定要处理一下。一定要处理一下对吧,这个肯定要处理的啊,那么接下来这个东西肯定不要了,All的ID all ID上面都已经有了啊,这是重复字段,肯定就不要啊,Activity ID这个呢,都保留SKD不需要了,因为上面肯定有对吧?啊,那这边有SKD商品信息肯定有了,对吧?好。哦,那接下来。Create time。这是我们创建时间,那其实可以不要,因为这个创建时间是什么,是订单明细活动的创建时间,那么他当然跟订单明细是同一个时间了。对吧,那只要我订单明细里边有这个创建时间,那就够了,对吧,所以这个时间也是属于重复字段啊好,那同理,这个就好处理了,这个呢,拿过来改吧改吧就行了。
20:10
对吧,这个ID你也不能加ID,你得加一个cup。得加一个carbon对吧,好,All ID的ID不要。Come ID保留,ID保留SD跟这个time不要。好,那到现在为止呢,咱们相当于把这个字段就怎么样处理。完了对吧,哎,那这是我们所有所需要的这一堆字段,对吧,那逗号没加是不是,那我们加逗号啊。CTRL加又又在。呃,我看啊,应该够了是吧,啊在这个位置啊加一个。逗号当然有的字段改了名字的字段有问题啊,你注意你看这个逗号加这来了,那肯定不对啊,你像这种细节你要把握一下啊,那这儿一样对吧,这两个呢,我们改了名字,因为多了一个。
21:06
具体的本来在这后面是没有毛病的,对吧,但是呢,你后面多了一个字段,你再往右移要多移一个,但是呢,我们就没移,我们就直接这样OK吧,啊,这是我们所有的字段啊,终于。是不是这个so写出来就感觉有一点像那个生长环境当中so了呀,对吧,其实你说它多难嘛,它不难。但是呢,你不小心还容易出错。是不是你不小心,你稍微不注意可能就。出错了啊,你稍微不要不注意啊,就这个出错了,因为字段多。磁带茫茫多。对吧。好,那CTRLC。拿过来。往这一放,看到R,把这个替换成空格。
22:01
好,得到一个。That。Table。啊,那同理,咱们呢,把这个处理一下啊,Table create啊,然后呢,Result。Table。啊,对吧,好。之后呢,做一个打印测试啊。打印测试啊,那这个呢,干掉,接下来呢,把这张表给他。放进来。对吧,前面我应该都注释掉了哈,都注释掉了啊,等会呢,我们把这个表打印一下。好吧,好,那这块呢,就。搞定了啊,这个呢,咱们就搞定了啊。呃,接下来呢,我们把这个东西做一个。测试。啊,咱们来看一下啊,咱们来看一下,哎,这个地方不能用这个了啊,我我怎么写的追加流啊。
23:00
我们用什么用撤回流吧,对吧,那因为现在呢,这个result table啊,他已经用了这个left draw了,是不是好,那咱们呢,得用这个撤回流没毛病吧,得用撤回流好那。行行。接下来我就不手动去造数据了。OK吧,你要手动造数据,你造不过来。你造不过来,你这个太麻烦了,对吧,我们就直接去用脚本去造数据啊。反正咱们的mal也是开的,我们就脚本,脚本呢往里写数据就好了,对吧,好。加了。高价睫毛走。这个你要一个一个造,你就很麻烦啊,你要注意哈,就很麻烦对吧,所以呢,咱们直接用用这个Mo去造就好了。看这边啊,还没有数据,这边没做完啊,造完了,造完之后呢,这边应该有数据了,哎,来了对吧,这个都是处,有没有这个撤回的false啊。
24:00
好像没有啊,因为呃,因为咱们的数据呢,来的都是。同时,同一时刻。你看没有false,只有处对吧?嗯,也还有另外一个方式证明它全是处啊,怎么证明呢?看啊,我把这个CTRLCCTRLF这个呢,看多少条,1145条看见没?然后呢,我搜这个。我搜这版的。啊。就说这么多。F1145对吧,说明它全都是处啊啊这里面数据呢,应该都关联上了,而且呢,我们主要看一下那个。推广对吧,关联微表,那么关联上啊推广的渠道,嗯,看一下关联那个dic那张表,从这就第一条数据吧,我们看啊看这条。这条数据里边我们推广的。哦。我只是关联了,我没加那个字段,大家还记得吗?也没有人发现啊。
25:02
呃,傻了,我只是把这个关联了,有写这个字段嘛,就这张表里边根本就没有字段,你发现没对吧,所以我们加一下,加一下在哪呢?我们写到这个下面了,这个啊在这。你们也没有人发现,是不是这边写一个什么呢,叫dic name。对吧,叫D啊,那同理咱们是不是也可以把它改个名字啊。咱们是不是也可以对它进行一个改名。操作呀,对吧,还是跟上回一样啊这个呢。啊,你们,你们已经麻了是吗?啊,其实我就想看这个啊,这个我提示出来了,大家应该知道吧。这个色个人就晕了。这个现在我给你提示出来了,可以了吗。应该能反应过来了吧,对吧,因为我们最后呢关联于这张表,但是没有取这张表的什么字段呀。
26:04
对吧,好,那得把这个字段放在这。得把子弹放在这儿啊,那那我就不改名字了,你改名字。你可能更受不了了,对吧,这个其实应该叫type ID,这个叫STEM,我还改一下吧,不改名字感觉他俩呢就没有什么关系,这个是ID对吧。关联关了个寂寞,对,关联没取这个字段啊,就把其他四个表的字段写上了,这个没写对吧?好,那我把这两行拿过来啊,注意把这两行拿过来改掉。就是还有一个东西啊,有的同学就。包括我自己有时候备课的时候会发现什么事呢?我发现一个错了,然后我在这疯狂改,改完之后呢,我就直接运行测试,诶发现怎么没效果,你注意啊,这个地方是我们的草稿纸对吧,你不能光在草稿纸上改了,然后呢,试卷上面不改,是不是大家之前考试的时候有遇到过这种情况呀。
27:05
啊,就是在草稿纸上把我们的东西改了,但试卷上没改。有发生过这个情况吗?以前反正我之前考试的时候遇到过这个情况。我以前考试的时候就是验算对吧,然后呢,在草稿纸上疯狂改了,诶把这个改了,以为就改了对吧,试卷没改,最后还在想这个分怎么不对呀,我这这都是对的对吧?跟跟其他同学一对答案,这都是对的呀,对吧?容易出这问题啊,因为我们在这改的啊,你一定要把这个东西想着移到这边来,你要不移。就没办法啊,我之前考试的时候。还好,你直接在答题卡上写,你好猛啊。你太猛了,我不行,我得先在草稿纸上写啊。
28:00
好,那我们重新去运行啊,重新运行我们来看这个结果对吧。这边。重新造一下啊,然后看那个主要看那个DC的内部对吧,我想看一下这个推广啊,所以我还记得那个推广,但是呢,刚才忘了改了。这边我们看一下啊,推广有吧,这是智能推荐来了,对吧,这个是智能推荐,这个呢,用户查询写了吧,对吧,其他的东西你看这个状态改了,这是一个update的操作对吧?Update的操作这是O,这是O表最后两个字段嘛,但是里边你看这一堆文档。说明什么问题?说明他并没有参与。这四个。活动。这四个购物券。他这个订单呢,既没有参与活动,也没有参与购物券,这很正常吧,那都是呢,对吧,因为我们这个里边能够去参加活动或者购物券的,哎,比如说这个数据就有。
29:05
看见没?这是有数据的吧,来我们看一下啊呃,这应该是活动。这边应该是活动对吧,这是哪一个1341346143对吧,1346143,你看活动啊。刷新。呃,1346143,诶你看1346143确实吧,它里边有数据参加了活动,所以呢,这边就关联上了,你看这个活动,但是呢,他并没有参加这个什么,没有领券。啊,他没有领券,所以呢这边。又是闹。对吧,这边又是闹了啊,那没毛病吧,啊那没毛病的对吧,好,那这个呢,咱们就测好了对吧,好了啊。好,这个就搞定了,咱们测试就完成。
我来说两句