00:00
好,那接下来呢,看这个图解,你看这个东西还是比较简单的,你发现没。对吧,整个的思路是比较明确的啊,但是呢,它里边的操作细节比较麻烦,需求难在操作上,而不是需求本身。对吧,需求分析,其实这个并不难,因为我们分析完了,你发现无非就是关联微表。对吧,啊好,那我们来看一下,首先呢,得消费这个订单下单数据主题吧,啊然后呢,呃,正常的,因为我们考虑到提取workma嘛,先得提取了,对吧,所以呢,我们。转换数据结构,当然其实你在这一步的时候就直接转成招聘也可以,也可以,你把那个时间戳补上对吧,也行啊,这个都都还好啊好,那转化为阶层对象以后,我们主要是为了。提取时间桌也好,或者说分组,因为刚才我们说了提取时间中呢,可以放在生成招聘之后嘛,这个也无所谓,因为你每条数据还是生成一个招聘,招聘里边本来就有这个TS,这没关系对吧?好啊,那我们看先做。
01:10
体羽神装还是仙座去虫都可以。对吧,先转化为Java病啊,那在这我到时候啊在这写在这写提取时间戳好吧,提取时间戳生成wordma,把这越早提取越好,对吧?啊好,那之后呢,如果说我们提取完时间戳了,我们可以转化为这个招聘。对吧,啊,而且呢,这里边我们要求的是一个东西叫金额啊,那是一个金额的事情,大家要注意,我们还有一个事情要做驱虫。上午说的left join产生的重复数据还有印象吗?对吧?所以呢,我会在这啊,嗯,我这儿没写出来,在这儿我会先提取时间戳。对吧,这个需求当中我们要做去重,因为你涉及到金额,如果你不做去重,那不完了吗。对吧,一定在这儿要做个驱虫,驱虫方案可还记得,因为这个里边我们涉及到了活动金额。
02:07
购物券金额是不是都用到了呀?对吧?所以我们要用哪一种去重方案?上午所讨论的由left join所产生的重复数据问题,有三种解决问题的方案,对吧?那这个需求当中,如果我们要做去重,我们用哪一种去重方案?很明显这个是要用第三种对吧,因为我们用到了右表数据。对吧,用到了右表数据,所以我们要的是最全的那个版本,对吧,所有字段最好都有的,但是我也不强求都有,对吧,所以要有定时器,假如说你没有数据栏,确实没有,只有订单表,没有什么购物券,这个就是零。
03:03
对吧,他有可能啊,他有可能就是零对不对,那你是零,那没办法,那那我就正常的写零啊。对吧,那就是这意思好那。也就是说我们要先做去重,我们要按照订单明细ID做一个去重,对吧,这个点呢,刚才没说,因为上午我们已经说过了,对吧,我说了10.9这个需求里边要做这个事情。对吧,要做这个去重,因为它也是下单表由level join产生的这个结果数据,对吧,有可能存在这种重复数据问题啊,所以呢,我们要根据违一键去重啊,那这个唯一建呢,就订单明细ID。对吧。好,完成之后呢,我们要转换数据结构为招聘。啊,转化为招聘,就这个东西叫trade trade SKU b OK吧,好,转化为招聘以后干什么事。啊,在这,我我到时候啊在这设置水位线。
04:01
因为这个地方呢,会做一个驱虫对吧?啊,会做一个驱虫,那我们其实在前面越早越好嘛,啊,当然你在这儿我当然说了,其实可以都可以。对吧,在这也行,因为我们扎并里边可以把这个时间戳保存下来啊好,那如果提前设置水位线,这个TS就可以不要了,对吧,就可以不写,最后呢,补充就行了,好设置完水位线之后呢,我们干什么?是不是分组开窗聚合呀,先按照SQID单独的分组,然后开窗聚合,聚合好以后,诶这块呢,并不直接写出去。对吧,并不直接写出去啊,而是要干什么呀。关联维表用来补充其他的维度字段。对吧,咱们要关联为表,补充其他的维度字段补充好以后。才能把数据写出对吧,我们要把其他的这些表全部关联上,对吧,有这个SKU info,诶,那首先要关联的SK,为什么?因为只有SK关联了,你才能有trade bug ID。
05:07
PUID3ID对吧,然后接下来呢,关联spu关联trademark啊。再关联开这给三诶获取二啊在关联二获取一,关联一获取他自己的名称,对吧,咱们有六张为表,要做关联这一块呢,比较麻烦。啊,主要。麻烦在哪呢?优化。主要是麻烦在对这个需求的优化上面,OK吧,这是咱们整个的流程,流程上应该没什么问题吧,对吧,但是我们说的这个东西啊,你写到这儿写到这儿都可以无所谓。对吧,啊,那这里面要做事情就取中。管理为表。这个是比较复杂的,其他东西都还好了。OK吗?这个整个的思路现在大家明晰了吗?因为之前我们是分开聊的,对吧,说与其他需求的不同点,现在呢,我们是把它串到一起对吧,看着要做的事情并不多,但是呢,这个需求还是。
06:07
跑不掉的复杂啊,这块有没有问题,整个的思路上就整个流程思路流程上没有问题的话,扣个一好吧。思路的流程上有没有问题啊。应该没什么问题吧?只有姚总一个人口音啊,来了,大家看到还是延迟比较高是吧,好。
我来说两句