00:00
这是这个拉里面的东西啊,就是大家之前之前的是没有问题的,这些没问题啊,那刚才是我的问题啊,好,那现在我们再回到DWS层啊,DWS层这边呢,呃,还是有一点这个小问题的。呃,哪呢,还是就是我我我们前面不是讲了吗?那个商品宽表我们看一下啊,呃,不是DWS,应该是DWT啊DWT这个位置我们往这个,呃,商品主题宽表往这个表里啊,咱们导数据的时候,前面不是讲了吗?这块这个表是有点问题的,就这。这块有点问题的啊,就是当初直接这个left照的时候呢,是直接照,那谁直接照的这张表,直接照的这张表啊,直接照这张表,那直接照这张表是肯定是不对的,因为它有可能会出现这个数据重复的问题,对吧,我们当时前面给大家讲了,我们照的时候应该照着谁应该照咱们这个是不是照这个整张的,这个整个照这个一个分区啊,而不是整张表,这是当前面给大家讲的这个事,但我刚才啊,我回过头来再看这个circleq呢,我发现还是有一点问题。
01:02
这个色还是有点问题啊,哪有问题呢?大家来跟我一起想一想。想一想什么,想一想咱们这个重要的连接条件。重要的连接条件,你说这么写它对吗?这么写对吗?这么写不对,为什么不对啊,大家跟我思考一下,咱们这个往商品主题宽面里边导数据,我们的这个思路是什么样的,咱们思路这样的啊,这边是我们这个昨天的这个这个宽表,这是咱们昨天的宽表的数据,对不对?咱们给它起的别名通常叫做old。对不对,那今天新导过来的数据,我们管它叫什么呀?就是今天有行为的一些数据,我们管它叫叫new对不对,New叫new,那我们的做法是什么?是把这个新旧数据进行副auto join对不对?然后用副auto join的这个数据呢?去和谁进行join,去和咱们这个商品维度表进行join,重要的目的就是为了拿到那个SPU。对不对,那大家现在想一想啊,你说我这个照连接条件,我应该写谁比较合适。
02:04
我写new行吗?我写O的行吗?其实都不行,为什么?如果你写new的话,那你能跟这个商品表撞上的是不是只有这一部分?是不是只有这部分,因为这一部分数据呢,它是什么?它是诶是空new的这个这个new的这边的SQD,它是nu。是no,你是不是就照不上,那照不上那这一部分商品相对来说你的PU就拿不到了。对不对,你就拿不到了,那你要写old呢,写old的这一部分能照唤上,那这一部分是不是照唤不上,那照不上是不是他的这一部分商品的SKU是不是也拿不到了呀?所以这样呢,你写new.sku或者是o.SKU都不行。对,都不行,所以这边要怎么办呢?诶要判断一下,这是大家应该注意到的一个小细节,一个小细节应该怎么做,应该这么写,NVLNVL来括号,然后呢,诶如果说new.m mid是空,那我就用O的点m mid这个s sqid。
03:02
你得这么去写才行。得这么写才行啊,得这么才写才行,OK,这块呢,大家要注意到啊,大家知道那old是这个不是有poidd吗?那我们来看一下old的有没有po ID啊,那这边是咱们的old,那这边呢是咱们的这个new,这边是咱们的new,那这样一来的话,你看一看啊,呃,O的是有s po ID的,但是我们join的时候按照什么join的呢?我们是按照SQID去join的。按照SKUID去join的,那这样一来的话,你看一下我们这个效果就变成什么样了呢?效果就变成这样了,来我们来看一下,呃呃join的时候,如果说咱们这这要写一个什么new,点这个midd,呃SQID要写一个new的S,呃用new呃去join的话,去left join的话,那这个效果是什么样的呢?就是说我只有是不是只有这部分数据是能够转上呢?那上边这部分数据咱们是不是这个呃转不上啊,转不上,那转不上,那也就是说咱们这里边呃所有的这个poidd是不是都是no啊,所有P所有的po ID都是no。
04:09
都是no,这个大家能看懂吧,都是no,那你看一看我们上边去往这个咱们最终的表里边去选数据的时候,咱是怎么做的。咱往这边选数据的时候怎么做的,你看啊。呃,诶,咱们这往最终的表里边写数据的时候呢,直接就写了一个什么,直接就写了一个SKUo.SQD。对不对,那即便你原来那个有有的话,那这边我直接选的是谁,直接选的是我SKU里边的那个midd,那里边没照上,没照上就是no,所以说他会把原来那个piidd给它覆盖掉,给它覆盖掉是这样的啊以下边呢,你必须得把那全照上才行,那或者说你这下边你就就只照,就只用那个new去照,呃,不去做我那个判断也可以,怎么样呢?你在这做一个判断。在这做一个判断,你看它是不是空,是空的话,那你就用旧的,不是空那你就SQ in了。
05:01
是这样的,这个两种解决方案,你要么在这改,要么呢,跟我一样,把下边这个照连接条件给他改一下,给他改一下,这两种方法呢,诶都可以,都是可以的啊,那这边呢,咱们改这呢会呃更方便一些,改这更方便一些啊,那也就说大家记住咱们跟skuer join的时候呢,一定得保证每一个SKU跟这个SKU引份都得能够撞上才行。都得能够照上才行啊,要不然的话就会出现咱们PU变为闹的这种现象,OK,这是咱们这边呢,呃,这个小错误,呃,那这边这个circle改完之后呢,那下边呃,脚本还是有点问题的,脚本是是因为那个有笔误,脚本是因为有笔误啊,那这个circle得这么去写,那脚本怎么写呢?脚本我往下看,脚本来到底下啊来底下。往下走往下走,诶在哪呢啊脚本呢,在这个位置,脚本在这个位置啊,那脚本前面是怎么回事呢?脚本是这么回事,脚本呢是那个当初改这个的时候呢,呃,不知道怎么把这个left给它去掉了啊,那个是不小心去掉的,那这边需要给它补上,需要补上,然后补完之后呢,下边这个里边呢,大家来看一下啊,你需要这么去写上去写上,然后别名这么写,然后这边呢,呃,脚本有问题是哪有问题呢?脚本有问题是因为咱们那个old和这个new。
06:21
这个别名脚本跟上边咱们那个SQ不一致。咱们上边那个旧数据我们叫old,新数据叫new对不对,那这边他这个,呃,因为不是一个老师写的啊,不是一个老师写的,所以别名写的可能呃不一致,别名写的不一致啊,那这个呃脚本当中呢,呃,Old它那个别名叫做什么SK topic。那这个新的数据里边这个new呢,它叫什么叫做ss k act,就只是别名的问题,只是别名的问题啊,所以说大家这块呢,你看这是他这个别名,这是这个啊,所以说大家呃,写的时候呢,只要把这个别名改回来就行了,那这次我这个应该是没问题了啊SK topic联,这就相当于是咱们那个old,那这个SQ,这相当于咱们那个new。
07:03
哎,是这样的啊,那这回应该是没问题了,这回应该没问题了啊,好了,就是这点小问题,这点小问题好,那把这个视频先录一下啊。
我来说两句