00:16
呃,好,各位同学,那咱现在呢,是不是已经把这个所谓的这个人数的问题,已经就是重复计算的问题已经解决了呀,对吧?呃,当然解决之后你会发现啊,我们现在最终建出来的这个DWS的汇总表,跟我们之前最开始规划的还一样吗?是就不一样了呀,对吧?哎,包括我们之前那个指标体系是不是好像跟咱们现在也对不上了,对吧?所以在咱现在呢,需要把这个指标体系给它稍微的去调整一下,那首先我们先改这个脑图啊,先改脑图,那现在呢,我们看一下第一个指标。第一个指标是不是让我们去计算那个什么最近173是各品牌订单数啊,对吧,就是按照我们原来的规划呢,我们是直接给他建一个品牌力度的汇总表,但是我们建完品牌力度汇总表之后呢,我们发现算那个人数的时候,它是不是会有问题啊,对吧?那所以最终我们就不用那个表了,咱们现在换成什么表了,换成了一个用户品牌力度的一个汇总表了,对吧?那所以说你想一想,咱这个指标,它现在的计算逻辑还是直接从一张市值表聚合吗?
01:16
就不是了吧,对不对,我们让应该让他从哪去取取出啊,你算这个指标时候应该从哪取出,是不是应该让他从我们刚刚所建出来的这个用户品牌力度的汇总表里边去取分了,是是这个道理了,就不再是直接从市表里取了啊OK,好,那所以在这儿呢,我们需要把它的计算逻辑稍微的调整一下,现在呢,应该是由一张是不是中间力度的汇总表聚合得到结果了,对吧,我们应该由由一个用户品牌力度最终再聚合成咱们这个结果的品牌力度吧,对不对,OK,好,这个其实比较简单啊好,那现在呢,我们把它调整一下,那我们当前的这个计算逻辑应该是由应该是由一个这个中间哎中间力度的汇总表聚合得到,哎,是这样的吧,OK,好,那接下来呢,咱们继续往下分析,那现在呢,我们是不是建了那个汇总表对不对,它的这个指标定义跟这儿是不是也是不一样的了呀,对吧,所以这块咱们也要调整一下,那在这儿呢,我直接CTRLX。
02:17
OK,那咱们现在相当于什么呢?相当于实际上这样的,它实际上呢,确实是一个派生指标,但是呢,我们没有让他直接从一张实时表聚合得到,对不对,也就是他现在应该是怎么样呢?是不是会依赖一个其他的派生指标啊,对吧?诶是这样的啊,所以在这呢,我们给他来一个,就是他依赖的这个派生指标是什么?OK,其实它依赖的派生指标我们就放在哪块了,咱们是不是就放在了我们刚刚所见的那两张汇总表里边来,对吧?诶这这是就这两个汇总表里,其实就放在这边啊,是这样的啊好,那接下来咱们就找一找它一代的派生指标到底是哪个,来咱们分析分析,你说他一代的派生指标是哪个呀?我把这个删除啊,咱们把这个定义给它定,定义出来,它依赖的派生指标应该是哪个呀。
03:04
咱们这个刚刚给他建的这个汇总表里是不是有很多的派生指标啊,对吧,那它依赖的是哪一个。他依赖的是不是应该是每个人购买每个品牌的次数吧?没问题,你说你说是不是这个道理,你要是想去算这个最终的各品牌的被下单的次数,你不得把就是诶购买同一个品牌的每个人的那个购买次数是不是加一起,是不是才能得到这个各品牌的购买次数啊,对不对,所以说实际上他现在依赖的派生指标呢,实际上应当是这个是每个人购买每个品牌的次数,这个大家稍微的理解一下好了啊,那这个这个这个派生指标,我们要想用这种标准化的方式去定义,那我们这儿应该怎么定义呢?咱们这是不是得调整一下,首先这个业务过程仍然是下单,然后咱们算的是不是仍然是购买次数啊,对吧,所以这个还是放在一没啥问题,那接下来往下走,那下边是什么,是统计周期还是它没问题,那唯一不同的应该是就是啥,就是力度吧,咱们现在力度应该叫做什么力度了,叫做用户品牌力度了,对不对,OK,那也就是说实际上呢,当前这个最终的一个指标,它依赖的一个派生指标呢,就是它,而这个派生指标我们就位于哪儿,就位于刚刚咱们设计出来的是不是这张汇总表里啊,对吧?好,那将来我们再去算这个最终的指标的时候呢,我是不是应该让他从,诶从哪儿,是不是从它依赖的这个中间的这个互动表聚合得到啊,对吧,也就是基于谁基于它是不是在做进一步的聚合啊,对吧?啊就是这么个逻辑,那这实际上才是咱们现在的这个指标体系的一个,诶最终结果这块大家要稍微的理解一下啊,稍微理解一下行了,那这个完成之后咱继续往下走,那你说上面要是改呢,那这个要不要改呢?这个咱也得改。
04:47
一下吧,对吧,它是不是也不再满足咱们当前的这个具体情况来,对吧?OK,那首先计算逻辑咱们现在就变了,我们在算它的时候,你还是让他从实时表聚合吗?不是了,我们应该也是让他从哪来呀,也让他从我们刚刚是不是建的这个汇总表里边去取数去计算呀,对不对?OK,这个要理解一下,所以在这呢,咱们也给它稍微的调整一下,我们把前面的这个给他复制一下就行啊,CTRL为拿过来,那当然呢,他现在是不是也不是直接对应一个派生指标了,对吧,我们也应该是让他怎么样呢?是不是让他去依赖另外的一个派生指标,相当于对不对?那现在问一下大家,你说他依赖的派生指标应该是谁呀?
05:22
我们要想算一下什么各品牌的订单人数对不对,那它依赖于我们这张汇总表当中的哪个派生指标,它是依赖于这个人购买品牌的次数啊,还是依赖于人购买品牌的件数啊,还是依赖于人购买品牌的金额。咱们这的派指标是不是主要就这几个呀,对吧?哎哎,你说他依赖于谁。好像哪个都不依赖吧。对对不对,是不是好像哪个都不依赖没问题吧,你想啊,呃,就是我们再去刚才比如说我算人,就是算各品牌的这个被购买的总次数的时候,我是怎么算的,我是把每个人购买这个品牌的次数是不是求和得到的呀,对不对,但这个人数你要算,你应该怎么算人数,你需要对这些东西求和或者怎么怎么地吗?不需要,对吧,人数你怎么算就行了,你只需要拿到这张表的数据之后呢。
06:13
是不是按照按照谁进行分组,按照品牌吧,因为你最终最终你要干啥,最终你是不是要算各品牌的呀,对吧,直接按照品牌分组是不是就完事了,那完事之后呢。是不是count distinct一下UID,那就完事了,对吧?也就是我们这儿的这个聚合逻辑,将来应该是一个count distinct的UID,对吧?OK,那它会依赖于我们这里边现有的这几个派生指标吗?其实根本就不依赖,那那能理解吧,那所以说这几个派生指标无所谓,它不依赖于任何一个啊是这样的啊好,那那那这块咱们这个指标体系我要写的话,我应该怎么写呢?这个是不是有点麻烦怎么写?诶咱们这么写,我先写上,然后大家再体会一下里边到底是什么意思啊,那在这儿呢,我直接给他也来一个依赖的赖的这个派生,诶指标,那之后呢,我把它给它复制过来,那之后你看我这怎么写啊,我这么去写,首先业务过程肯定得是下单,但是度量值是什么?
07:12
这个无所谓,我这写一个星号对不对,那OK,那这个呢,我也无所谓,我也写一个星号啊,是这样的啊完了之后呢,统计周期一期30没问题,业务限定没问题,统计力度呢,咱们是用户品牌力度。啊,我这么写大家看能不能体会出来是什么意思,也就是说我这个想算各品牌的人数的时候啊,OK,那我依赖的这个派生指标当中,你的度量值,你的聚合逻辑无所谓。无所谓,因为啥呢?因为我在算人数的时候,我用到了刚才这个什么older count older number older to amount,我根本就没用到,所以说是谁无所谓对不对,我只需要保证什么就行了呢,我只需要保证你这个派生指标,OK,你的力度是用户品牌力度,你的这个业务过程是下单才行,因为你要算的是下单人数,你那不能是别的对吧?啊,必须得是下单,OK,那完之后你得保证统计周期得是一七三十的,因为我这儿就要一期30嘛,对不对,你只要保证这几点那就够了,然后至于你的聚合逻辑是什么,至于你的度量值是什么,无所谓啊,是因为你得知道咱们从这里边算的时候,你怎么算的呢?你是不是就是按照品牌分了个组,按照用户是不是进行了一个抗的第一次性的统计,是不是就完事了,对吧?那所以说我只要保障我的力度是品牌用户力度就完事了,哎,至于你的聚合逻辑到底是啥无所谓啊,所以在这儿呢,咱们写一个星就就就行了啊,就这个意思啊,也就是说那一会我们在算的时候,我们从这里边取数,但是呢,我用不到这几个值,哎,就这个意思啊,这个大家稍微的理解一下就行。
08:42
啊好了,那这实际上呢,就是咱们这个,呃,各品牌订单人数所依赖的这个派生指标的一个最终的定义,哎,咱这这么写就能够表达这个具体的意思了啊OK啊好了,那截止到现在呢,我们前两个需求,咱们这个派这个指标体系,咱是不是就改完了呀,对吧?当然这儿改完之后,理论我们下边这些东西,理论下边一个是不是也都得进行相应的调整,对吧?这个我们暂时就先不去一个一个调整了啊呃,这个一会儿我利用课下的时间,我把它改一下就行了,改完之后我给大家发下去,大家自己看一看就行。好,那接下来咱们继续往下走啊,你说你这儿要是改完了啊,这儿改完了,那你说我们哪也得调整一下。
09:19
赶紧调整一下,是不是这个地方咱们也要调整一下呀,对吧?因为我们现在就是这些需求所依赖的派生指标跟原来是不是不一样了呀吧?OK,那现在咱们需要去调整一下,好,那现在我们快速的调整,那这边要调整的话怎么调整?呃,首先第一个,第一个它所对应的应该是哪个派生指标,应该是这个派生指标了,没问题吧?OK,那它跟刚才的区别是不是主要就是这个力度发生变化了,对吧?我们把呃这个原来的品牌改成一个用户品牌是不是就完事了,对吧?那第二一个呢,第二一个发生变化的就比较大了,首先力度变成这个了,然后聚合逻辑,我是不是就不用再纠结是什么了呀?对吧,这块直接来个星是不是就OK了,对吧?哎,直接来个星,这边也来个星,OK,这个上一个行了,那这样一来,这咱们也就调整完毕了。
10:06
好,那截止到现在各位同学,我们现在这个从前到后的这个内容是不是现在就是统一的了,对吧?OK,咱们咱们现在再从头到尾的给他过一下啊,比如现在我们这个将来要做的这俩需求,我们到时候再算的时候呢,我怎么算,我不让他从事实表直接聚合了,我让他从一个中间力度的一个汇总表进行聚合,OK,好,那你这个中间力度的汇总表里,我我我具体需要用到哪个派生指标呢?OK,那它是不是需要用到一个这样的派生指标,对吧?那我要想去算它的话呢,我是不是只需要用到这样的几个派生指标就完事了,对不对?OK,那完了之后,我正常情况是不是得把这两个派生指标拿出来放到这个脑卒当中,对不对?放过来之后你会发现它就是这样的,OK,那这样的一个派这这样的两个派生指标,我应该会给他去设计什么样的汇总表呢?是不是得去设计用户品牌力度,然后呢,下单业务过程,最近一和最近N天的两张表啊对不对,那这两张表是不是就正好对应我们刚刚改完之后的这两个表,这不就是用。
11:07
铺品牌力度下单的业务过程,最近一地的表和最近ND的表了,对吧,这个前后是不是就对应上来了,对吧?啊是这样的,那这其实就是我们设计出来的第二一个版本的表,哎,这是2.0版本的,OK啊,这个完成之后视频我给他停一下啊。来,那同学,那现在这个2.0的这个力度,咱们基本上确定下来,就是用户品牌力度啊好,那现在呢,我们再回到咱们这个具体的这个看这儿吧,咱们看这儿吧,麦克同学啊,那你想一想,你说你说你在算这两个派生指标的时候对不对,那我的力度我变成了用户品牌力度,那你想一想,你说我们下边这东西咱们还用再去试错吗?我们还用再去建一个品牌力度的这样的汇总表,品牌力度,品类力度,这样还用再去试错吗?应该就不用了吧,对不对,为啥呢?因为你按照这样的这个力度去设计互动表,是不是同样会面临一个什么问题?是不是那个人数重复计算的问题啊,对吧,因为你这儿要算退单人数,这儿也要算下单数,这还要算退展,他是不肯定也会重复计算对吧?所以说这边我们就不用再去试错了啊,所以针对这几个发险指标,咱这儿呢,直接就给他是不是调整一下就行了,对吧?那在这儿咱们调整谁啊,我们暂时先不去调整退单相关的指标,我们只调整下单的,来,咱们在这把这个下单的改一改就行啊好,那下单的在这儿我要改我直接改成啥就行,我直接是不是来一个用户品类就行,我就不用再去单独设计什么品类力度了,对吧?诶这个大家应该是能够想明白的啊啊,那在这儿呢,我们给他设计成用户品类,OK,好,那你想一想,那你就算成这个,呃,设计成这个用户品类之后,那我们给他设计的汇总表应该是什么样的呢?咱们最终设计出来的汇总表应该什么样的?
12:42
应该跟刚才咱们那个用户品牌力度是不是差不太多,对吧,唯一的区别应该在哪。唯一的PP应该是在那个纬度字段上面吧,没问题吧,OK啊,好,那咱接下来呢,就快速的把这两张表给它整一下啊,这个我们就不再去一点点写了,我们基于这个咱们改一改来,CTRLC咱拿过来,好,那现在呢往下走,这个呢,我们应该给它改成用户品类力度,咱先改名,这个应该怎么改,是不是改成cat GR简写一个cat就行了呀,对吧?诶,这是品类的意思,好,那这个可定自己拿过来把它改一下,诶这个也改一下,那这个呢,咱们也改一下,那现在用户品牌我们给它改成用户是不是品类啊对吧?用户有哎,改成品类就行了,好,那现在呢,这里边的维度字段是不是咱们要调整一下,像这些东西理论上应该是不用调的,对吧?好,那维度这儿应该改成什么,是不是咱们得改成那个分类啊对吧?哎,我们改成cat下游线,哎,然后呢,Ad,然后下边应该是cat name对吧?Cat下游线哎,然后来一个name,当然各位同学啊,呃,大家都知道我们那个分类实际上是分为好几级的,对吧,咱们有一级分类,二级分类,三级分类对吧?所以在这咱这么多啊,我就把这个三个分类的字段咱们都给它放在。
13:49
2CTRLV拿过来,那这边呢,咱们再给他拿一遍,拿过来好了,那之后呢,我们这儿给它去加上一个这个呃标识,这个就是来开那个瑞一的ID,一的name,二的ID,二的name,三的ID,还有三的name OK,好,那后边这个注释我就不改了,咱节省一点时间,大家知道怎么回事就行了啊好,那截止到现在呢,我们这张表是不是就相当于是改完了呀,对吧?呃,要写错了啊,这就4万了,删了啊呃,这个下划线给他写上好了,那这样一来123,那咱这个分类信息是不是就放在这了,那当前咱们得到的这个表是不是就是用户品类力度的呀,对吧?好,那接下来咱继续往下走,这是ED的表,那ND的表怎么调整啊,ND的表是不是也可以基于原来咱们那个用户品牌力度的ND表调整,对吧?来咱们给它复制一遍拿过来,这个数据状载还用写吗?不用写了吧,是不是应该是没啥问题对吧?好,那接下来咱们继续往下走啊,那首先表名我们先给它改成这个表名来拿过来,诶这个也改了,诶这个也得改了,好了,那现在呢,把用户品牌改成用户品类是不是就OK了?
14:49
对不对,那这里边儿咱们怎么调整,是不是也是只需要把这个品牌换成品类的维度属性就行了,对吧,这个咱们复制一下啊来CTRLC拿过来。这个conr好了,那截止到现在这个ND的表,用户品类力度的是不是也就搞定了呀,对不对,那这实际上就是我们最终设计出来的这个方案啊好了,那当然啊,就是这块咱们改完了之后,哪儿也得调整一下呢,就是咱这个最终设计出来的表,跟咱们最开始规划的这个指标体系是不是也不太一样了呀,对吧?哎,咱们也要给他调整回去啊,咱们快速的调整一下,刚才我们找的是哪两个来着,我们改的实际上是那个品类力度的下单的这个吧,对不对,没问题吧,咱们找到品类力度,找到下单应该是在在哪儿,在这在这儿呢,对不对?那首先在这儿呢,咱们调整一下它的计算逻辑,也不再是直接从一张事实表聚合得到了,也是从哪呢?也是从一张中间力度的汇总表聚合得到,对吧,应该是从这个呃,一个哎中间哎力度的啊这个汇总表聚合得到,呃,这个中间力度汇总表指的是什么力度的呀。
15:56
只是咱们那个用户品类力度啊,对不对,由用户品类力度是不是在聚合成品类力度啊,对不对,应该是这样的一个逻辑啊好了,那所以说那这个指标定义是不是也得改一下啊,对吧?那现在它应该是依赖另外一个派生指标了,对吧?OK,那它依赖的派生指标是谁呢?呃,来我们写一下依赖的派升诶指标,OK,那现在呢,我们在后边给他补上啊好,它依赖的是谁?调整一下,你要想算各品类的这个订单数,你应该怎么算,是不是得从这张表当中,这张表实际上是指的一个用户品类对吧?就如刚刚我们设计出来的这个用户品类,你得从这张边里去找什么,得找每个人购买每一个品类的次数,对不对?找到它之后呢,是不是把这个东西求个和,你就能得到一个品类的总次数了呀,对不对,应该是这个逻辑啊,所以它依赖的派生指标理论上应该是它啊好,那现在咱们去给它定义一下,呃,这边呢,首先下单还是下单没问题,那度量值呢,仍然是移居和逻辑仍然是抗的,这个都没问题,对吧,唯一的区别其实就是诶这个统计力度我们给它。
16:56
改成是不是用户品类就OK了呀,对吧?好,那接下来继续往下走,那下边这个各品类的下单人数呢?这个计算逻辑是不是跟之前也不一样了,对吧?不再是从实时表去口来,而是从一个中间力度的汇总点轮到对不对?那他现在是不是也要依赖某一个派升指标啊,对吧?那他依赖的派生指标是谁呢?
17:17
这个跟刚才那个各品牌下单是一个道理吧,对不对?我们再去细算,比如说各品类的下单人数的时候呢,我不需要对什么下单次数,件数和金额进行聚合,我只需要怎么算就行了,我只需要说count的一次定下UID就行了,对吧?所以说那我依赖的这个派生指标当中,我那个原子指标里边的度量值和聚合逻辑是不是无所谓啊对吧?写什么都行,所以跟刚才是一样的,所以在这边咱们还是CTRLX,我给它调整一下就行了,这里边咱写一个依赖的,诶派生,诶指标后边的CTRLV拿过来,呃,首先我们调整一下下单仍然是下单,这个是不是改成星就行了,这个呢也是改成星就行了,那下边这个力度呢,是不是也得改成用户品类力度啊,对吧,诶用户品类度好了,那截止到现在呢,那我们的这几个这个指标对吧,从前到后,那它就又是通的了,哎,这个就能对应上了啊行了,完成之后视频我给它停一下啊。
18:11
呃,来各位同学,那咱们现在呢,已经就是设计出来了几个这个ADS层的表了,呃,这个DWS层的表了,对吧?设计完之后我们来看一看我们到底怎样用它去计算我们这个,呃,这个这个ADS的指标啊来咱们还找到ADS最终的那个指标,来咱们去找一下往下翻,往下翻啊找到ADS指标在哪了,在这儿了,我们刚才用的是谁来着,是各品牌商品交易统计,各各品类商品交易统计,对吧?但实际上我们现在设计的表咱们只有谁呀。只有下关下单相关的统计吧,对吧,我们现在能算各品牌的是不是下单数,下单人数,还有这个各品类的下单数,下单人数,退单的咱们是不是现在都没有动,对不对,退单没动,所以说我们现在就先举两个这种下单的例子,咱们去说一下啊,比如说我现在呢,想去算一下什么东西呢,就想去算一下最近一天的对吧,各品牌的订单数和订单人数,还有最近七天的各品牌订单数,订单数,你说这个东西咱们应该怎么去算来,咱们分开算啊,先算最近一天的,最近一天的各品牌订单数,订单数,这个咱们应该从哪张表里取数,大家说。
19:20
最近一天的啊,各品牌的订单数这样从哪取数,是不是肯定得找汇总表啊,对吧,那汇总表我们找什么业务过程的汇总表了,是不是得找下单的这个业务过程啊,没问题吧,OK,好,那完了之后呢,我的统计力度,咱们这是品牌力度,你要找的话,你只能找什么,你只能找比他力度小的还是大的,你说。小的吧,对不对,那比的小的力度是不是有一个用户品牌力度啊,对吧?那咱们可以去找大,因为我这个力度你可以从小的力度聚合到是不是大的力度啊,对吧?但是你要得到大的力度,能再给他拆回种小的力度吗?你拆不回去对不对啊,是这样,这个一定要理解一下啊好,那所以在这儿呢,我们应该找用户牌力度没问题,那统一周期呢,咱们刚才说了,我现在这不是只算最近一天呀,对吧?所以找异地的汇总表呗,没问题吧,好,那咱们现在就去找一下,呃,OK,那找到我们刚刚所描述的那张表啊,也就是谁是不是也就是他呀,对吧?诶下单,然后呢,是用户品牌力度,然后呢,最近一日没问题吧?好,那怎样从这张表里边去计算我们所需要的,诶,各品牌的最近一天的下单次数和下单人数怎么算呀?来咱们尝试去写一下啊,我们是不是就直接select之后呢?From哪张表是不是就刚刚我们看到这个DWS层的是不是交易的用户品牌力度的订单汇总表,没问题吧?好,那完之后拿它几个分区。
20:40
这是一个分区表,那几个分区一个分区吧,我们是不是只需要算最近一天对吧?只需要算最一天,那是不是就只拿最近一个分区就完事了,对吧?我们来一个2020杠零六杠幺四,那是不就OK了,对不对,那之后怎么做呀。需不需要分组,需要分组吧,对不对,为啥?因为咱这张表当前的力度是用户品牌力度,你记录的是每个人购买每个品牌的次数,建数金额,而我要算的是什么是一个品牌对吧?被下单的总次数,那你不得把购买这个人的这个购买这个品牌的每个人的次数加一起嘛,对吧?那所以说你得聚合一下啊,所以在这儿呢,我们需要做分组聚合,按照谁分组呢?按照品牌进行分组,ID拿过来,Name幕呢,咱也给他拿过来啊呃,Tme哎,那name拿过来好了,那完成之后我们继续往上看啊,那上面咱是不是就可以去选一下ID,选一下这个name了,对吧?那之后呢,俩俩俩东西要求一个是次数,一个人数,对吧?那次数怎么求行?次数是不是可以直接求和,我们萨求和对谁求和,求一下这个o count是不是就完事了,对不对?这个没啥问题吧?OK,那接下来下面这个呢,怎么做,是不是直接来一个count distinct里边放上一个u it。
21:55
低,那是不是就完事儿了,对吧?诶,那这样一来是不是就得到了最近一天里边各品牌的什么东西,诶这个被下单次数和被下单的人数啊,对吧?那这个是不是就已经得到了我们这个需求最终需要的这个结果了,对不对,其实就是这么个逻辑啊,就是将来咱们再算它,我们是从DWS的汇总表里边去算的,哎,这一点要理解一下,好了,那接下来咱继续往进行,那这个一天呢,咱要会求的,我们来看一看七天呢,大家会不会求,呃,最近一天的各品牌订的时候订的人数,你说我们应该找哪张票啊。
22:29
是不是理论上我们应该找下面那个ND的表,对吧?好,那现在我们去找一下ND的表啊,这是不是就是咱们那个ND表,OK,那完了之后咱们来看一看,我从这张表里去算,我应该怎么算对吧?你要算的是最近七天的各品牌的啊,这个这个订单数,订单人数啊,这个怎么求。这怎么求?首先你得先明确一下,咱们从这张本里取取几个分区。取几个问句。
23:01
嗯嗯,你要想知道怎么从里边取数,取几个分区啊,你得首先得明确,就是这两边的表结构咱们得熟悉对不对?首好,首先咱们回忆一下啊,这张表的表结构应该什么样的,每行指的是什么来着,每行是不是就是一个人购买一个品牌它的相关统计啊,对吧?这个统计有什么?有这个人在最近七天内购买这个品牌的次数、价值、金额,还有这个人在最近30天内购买这个品牌的次数、价值、金额,这是他每行所代表的含义,对吧?好,那他分区是按照什么规划来着,按天我一天一个分区,对吧?每天的分区里放的都是什么?截至当天的最近N天对不对?那你想我现在要算的是什么?是最近七天里边各品牌的下单次数,下单人数对不对?你说我应该怎么去出,只需要拿一个分区数不就行了,你拿到这一个分区,你就已经拿到了什么,拿到了截至最近就是截至今天的,诶每这个最近七天里边每个人购买每个品牌的次数啊,对不对,还有每个人购买每个呃这个这个品牌的件数金额等等,是不是已经得到这些东西了,对吧,就已经。
24:01
得到,所以只需要拿一个分区就行了啊来咱from dws,我们找一个ND,应该是下边这张表ND啊,我们只需要拿它的最近一天的分区,好,那之后咱怎么做呢?之后怎么做,之后咱也得干啥,也得分组吧,对不对,也得进行格入半啊,OK,那葛入半还是t m midd和t m name啊对吧?来,来一个name好,这个没啥问题吧,那接下来继续往上走,你说上边我应该怎么办呢?是不是选一个midd出来,选一个name出来,对吧?这个没啥问题吧,那接下来呢。理论上是不是也是求和对吧?因为咱们现在得到的结果是什么?你得到了就是在最近七天里边,或者是最近30里边,诶,每个人购买每个品牌的这个次数限入金额,对吧?那是不是还是把这个人啊,对对对不对,购买这个品牌的总次数,呃,这个就是购买同一个品牌所有人的次数都加起来,是不是能得到这个,呃,这个这个品牌在最近七天的这个被下单次数啊,对吧?啊也是求和,所以说在这儿是不是也是直接算布求和,但是求和的话呢,你注意啊,这有俩次数,一个是七天的,一个是30的,对吧,你应该求谁呢?显然是七天的嘛,因为我们现在只算7D的啊,我这标注一下,我只算七啊,这个没啥问题吧?好,再进来就是人数了,对不对,人数这个怎么修,是不是也是来一个count第T的里边放着一个啥user ID,这个是不是就完事了,对吧?这个真的完事了吗?你这么算会不会有问题。
25:28
这个算会不会有问题,会不会有问题,大家琢磨琢磨。这个人数会不会有问题?其实这么算还是不对,为什么还是不对呢?呃,这个倒不是说有重复计算,这个重复计算的问题咱已经彻底的解决了,对吧?这个问题不再重复进在哪呢?来,咱们琢磨琢磨课同学啊,就是这张表,咱们再往里边进行数据装载的时候,咱是怎么做的,往下看。咱是这么做的,对吧?我们是从一地表里边取了几个分区,取了30个分区对不对?OK,然后呢,是不是对数据进行了一个统一的聚合,然后呢,有条件的求和得到的是七天的值,对吧?然后呢,直接求和得到是三人的值对吧?那现在我们来思考一个这样的场景,你说举个例子啊,就是有一个人对不对,在最近30天里边购买了一个品牌,就是下单了一个品牌下边的商品啊,但是呢,这个最近30天呢,他不在最近七天里边,就是在最近七天之外,但是呢,又位于最近30天之内。
26:28
对不对,他这是他的一个下单日期,有这种情况吧,对吧?好,那这种情况你说你对他进行聚合之后,你说这个人会不会出现在我们这张表的,比如说今天的分区里边会出现吗?他其实只要在最近30天里边购买过一个品牌,是不是就会出现在这个分区当中,对不对?OK,那言外之意是什么呢?也就是说出现在这个分区里边的一个人,并不能代表他在最近七天里边就买过这个商品。对不对,因为它即便在对应器上面没买,它也可能会出现里边嘛,对不对,所以说我们在算人数的时候,你直接抗的第点,你可能会出现一个什么问题呢,就是算多了的一个问题,对不对,OK,那所以这你直接这么写就不对了,那怎么写才对呢?怎么写才才对呢。
27:13
咱也怎么算,也就不是所有的人,他可能他都买过这个品牌对不对,有的人可能买过,有的人可能没买过,所以说我应该只算什么样的,只算买过的对吧,在最近七待里面买过的对不对,那最近期待里面买没买过,这个怎么能看出来呢。你看谁就行,你看欧德康的7D能能看出来,欧德康的7D大于零,那就表明这个人在最近七天里边买过这个这个品牌没没没没问题吧,那如果你等于零,就说明你没买过吧,对吧,那坐在这儿咱们应该怎么做呢?我们应该是做一个有条件的炕吧,对不对,你买了我才算,你没买我就不算,对不对,那怎么去做这个有条件的炕,很简单,里边是不是再来一个衣服啊,对吧,衣服怎么写all尔com的7D,你得大于零,诶我才认为你买的这个品牌了,对吧,你买了我是不是才算一个人呀,把它对不对,否则的话呢。
28:06
否则我就不能算它,对不对,那我这应该写什么,我写零行吗?行吗?我得写now吧,就这为什么一定要写闹,很简单,因为咱们这前面用的是count,你要你要是在count的时候,你不想统计它,你就得给它变成啥呢?就在那闹,因为countt不统计闹值嘛,对不对?这个大家一定要理解一下啊好了,那也就是说咱们在算最近七日的这个下单人数的时候,那咱们必须得这么去算才行,诶这个实际上是大家需要去注意的一个问题啊好了,那截止到现在呢,那我们这个怎样去用这个数据就已经说完了啊,OK啊好了,那也是从目前来看啊,咱们现在设计出来的这个汇总表,也就是V2.0这个2.0版本啊OK,能不能满足我们将来ADS的需求呢?能满足吧。能不能满足就是看你能不能把指标算出来的,咱们能不能算出来没问题,我是能够算出来的,对吧,是没问题的,也就是说实际上我们目前设计的这个DWS的汇总表呢,就已经能用了,就已经能用了,但是它是不是最优的方案呢?是不是最好的呢?这个还有待商榷,对吧?OK,那现在我把这个视频先停一下。
29:08
那。
我来说两句