00:00
啊,那接下来呢,我们看第四张,也就是第三张表是订单的宽表。啊,我们要做一张订单的宽表,方便后续去取这个数据,对吧?啊,那我们看一下啊,其实在我们现在做了很多的业务了,发现与订单相关的是最重要的订单统计分析的一个重要对象,而往往跟订单挂钩的这种需求也都是怎么样比较难的需求。对吧,啊,都是比较复杂比较难的啊,那围绕着这个订单统计的维度比较多,比方说用户地区,商品品类,品牌对吧?啊trademark category,然后呢,User province等等这些东西呢,都要去做这个处理好,那为了后续的统计方便,所以我们提前做一张大款表,后续呢,直接拿数据对吧,那正常的来说,这些呢,都是一个独立的表,而在我们订单当中。我们订单当中只有这个ID对吧,用户ID provi ID啊,SQ ID ID trademark ID,并没有它具体的名字,但是我们要对这个维度做分析的话,我们肯定要拿到它的一个。
01:13
名称对吧,拿到它的一个name才可以啊好,那在这个基础上呢,我们来看一下,也就是说最终我们要做的事情就这样子,因为我们首先啊,这里边两个浅色的部分。这两张表对吧?嗯,那这个颜色划分明显大家能看出来是根据事实表和维度表去划分的啊,那为什么让分呢?因为事实表呢,在卡不卡。而维度表呢,现在都躺在Phoenix里边。对吧,都在Phoenix里边,我就不写了,好,那这个时候。这两张表为什么有这两张呢?因为我们做订单是跟生产环境当中绝大部分公司用的这种订单是一个道理,用的是子母订单。
02:01
他呢是整个的一张订单,而这个是订单明细啊呃,我们知道下订单的时候,我们可以同时下好多件商品。我们是可以下好多件商品的,对吧,而。订单明细是针对于某一个商品的,那只有订单表,我们是没办法关联SKU表的。我们是没有办法关联SQ表的,因为订单表里边并没有SKUID。并没有SKYD。对吧,所以我们首先要做的事情就是说这两张表要做一个什么关联。啊,要做一个关联啊,那他俩都来自于卡夫卡,两个事实表都来自于卡夫卡,这个时候我们那卡夫卡呢,这肯定是流流读进来,这个也是流读进来。
03:01
对吧,那肯定要用到一个什么知识点了。我们得要用到什么知识点了?好,彭总说,Connect。还有其他同学发表意见吗?对,这个地方呢,要用双流join啊,两个流要做join了。Connect当然也可以啊,Connect也可以,但是呢,麻烦很多,Connect你要自己写状态了,两边都要写状态,很麻烦这个事情啊。很麻烦,所以这个地方呢,我们要用双流join引好,然后接下来我们的思路呢,是装好之后。
04:02
装印好之后是不是去Phoenix表里边分别去查这个维度信息,根据ID写一个S去查一下,查好之后关联进来吧,有没有问题,思路上有没有问题,其实这个需求的思路很简单,对吧?那无非就是说两个实时表,双流照语,然后呢去菲hoix当中查询维度信息,然后呢,补充字段完了。对吧,大家也很能想明白这个问题。思路有没有问题,先告诉我这个问题啊,思路上有没有问题啊。能理解的对吧,啊。好,呃,那这是我们的一个思路分析,所以第一步呢,我们应该先解决。
05:01
Join的问题,刚才不是有同学说了join没讲吗?那这个地方我就要来讲了,我刚才说了时间没到对吧?这个地方呢,我们来聊一聊这个join,没办法我得讲,要不然我就可以直接用了啊,这个地方呢,还得大家去熟悉一下这个代码,在文档当中给大家去找一找这个事情对吧?好,那这个呢,我们先解掉,这我们需求分析啊,需求分析呢很简单对吧?啊,需求分析是很简单的一个。
我来说两句