00:00
嗯。呃,好,各位同学,那接下来呢,咱们再继续往下进行,呃,那下边呢,我们要看的一张表是什么?是呃,交易与省份力度对不对?呃,然后呢,是订单最近一日汇总表,哎,大家来想想,你说这张表里它会存什么信息啊?省省份力度啊,OK,然后呢,是订单最近一直的汇总表,那他你说相当于他是把什么汇总到一起了是吧?啊,订单表里边的最近一天的下单记录是不是汇总到省份这个力度了,对不对,那你得到的结果是什么?应该是在最近一天里边每个省它的一个下单的总次数,总件数,总金额吧,对不对,应该是这样的啊好,那现在呢,咱们把这个减面语句拿出来一起过一下就行了啊来吧,CTRLC咱给他拿过来,好,那现在看一下这张表的最终的界面语句,先看一下它的表明,叫做dws trade的交易域province,也就是省份对吧?那后边呢,是它的业务过程下单,然后异地是最近一天,行,那现在我们继续往下走,明确一下它的行还有列啊,每行大家所指的的应该是什么?
01:06
一个省对吧,这个应该很明显对吧,一行是一个省,那完之后呢,我们来看一看具体的字段啊,字段呢,首先先看前面这一部分,这个字段有点多啊,这些东西其实对应的都是什么东西。都是省份的维度信息吧,在这儿我们相当于做了什么操作了维度退化对吧?OK啊好,那大家还记不记得我们退化进来的这几个字段都是什么含义,还记得吗?名称这个不多说,这仨是干啥的来着?呃,艾薇尔扣的是一个我们国内通用的地区编码,对吧?它能够唯一个编码,能够唯一代表一个省份,那下面这俩呢?呃,对,它是我们国际上通用的一个,就是每个国家的,就是省级的一个行政区域,是不是这样的一一套编码啊,对吧?是国际通用的,这个大家要搞清楚,当然我们这儿看到的这俩编码呢,其实他们都是IS362,这个三幺六二指的是什么?指的是我们这个是个标准化组织的一个什么呢?就是每一个标准的一套,相当是一个编号啊,对吧?他每一个标准都会有一个编号,那完了咱们这个就是地区编码呢,它的这个编号就是3166杠二,它俩都是316杠二,那完了之后呢,这儿之所以会有俩,是因为它有一个新版和一个旧版对吧?这一点咱们要了解一下啊,是这样的啊好了,那这个编码咱们搞清楚是呃是呃,这个字段是什么咱们清楚了,那会他们有什么用来着,是给谁用的来着,给后续的可视化工具去使用的,对吧?OK啊,等我们把这个需求真正做完之后。
02:34
后我们会去做一个简单的报表,到时候呢,大家就会用到我们这儿提到的这几个字段了,啊,到时候咱们用的时候再具体的说吧,啊行了,那这几个字段咱们就回忆起来了,接下来继续往下走,呃,下边这些字段是干什么的呀?这是这是不是就是咱们这几个统计值了呀,对吧?当然这几个统计值在这儿的含义应该是啥呀。应该是每个省份它的这个在最近一天的下单总次数,下单总件数,下单总金额了,对吧,这个理解一下啊,行了,那这个呃,字段咱们就看完了,分区我就不多说了,都是一样的啊,那接下来我们来分析分析它的数据状态,咱应该怎么做,它的数据状态怎么做呀。
03:10
这个我们就不去看了啊,咱们就自己分析分析,想一想就行了,我就不去粘贴了,不去复制粘贴了啊,想一想吧,这个怎么做。注意啊,这个有有有什么,它有退化的维度对吧?啊,那所以说我们是不是得去关联维度表啊,对吧?所以第一步我们应该先干啥呢?先找到下单的试时表,然后呢,过滤最近一天的数据出来,对吧?然后呢,我们是先去关联呢,还是先去分组呢?先分组就行对吧?先能不能先分组能啊对吧?因为我们那个明细实时表里是不是本身就有这个province ID对吧?OK,那我们直接拿到最近一天的下单明细,按照province ID先分组聚合对吧?聚合之后是不是这些计值咱就能拿到了对吧?那完之后呢,我们为了拿这些维度属性,再用统计的结果跟这个维度表去照完就完事了,对吧?照完之后,那我们把这个信息拿过来,那最终就能得到我们想要的这个诶数据了啊,是这样的啊,当然这张表呢,我们也要区分一个什么呀,也要区分一个首日和每日对吧,那首日的时候呢,我们需要去拿它的全表的数据,对不对,那那那谁的全表是不是拿那个明细时表全表数据啊,对吧?啊然。
04:18
方总,我们得,呃具体的说你得按照什么分组啊,得按照省份先加一个日期进行分组,分完组之后再去跟这个呃维度进行关联,这是第一点,那完了第二天我们应该怎么做呢?诶只拿这张表呢,是不是一天的这个分区的数据就行了,对吧?然后只按照省份进行分组,分完组之后呢,再去照这个省份为对,那就完事了,诶这是咱们这张表的一个数据的状态逻辑,在这儿呢,我就不再一点去去说了啊行了,那这个完成之后我们继续往下看,那它有没有就是相对应的N天的表呢?有没有,咱这是不是还是得去看一下这个派生指标啊对吧,咱们找一找与之对应的有没有来看一下这是省份力度,然后呢,这个业务过程是下单对应的应该就是这儿,对吧,那他是不是有一天的这种统计需求,也有N天的东西需求啊,对吧,所以说下边应该是会有一个跟它相对应的N地边了,来咱们找一下就在这儿了,哎,这是一个交易域的,然后呢是省份力度的,然后呢,订单最近N天的汇总表就是它,那现在我们还是只拿它的建表语句就行了啊,数据中来一句咱就不拿了,咱一会自己。
05:18
想一想这个怎么去做就行了啊来拿过来,那现在我们来明确一下这张表的具体的这个表结构,先看一下它的表名叫做DWS,然后呢,是交易域的省份力度的订单的最近N天的汇总表啊行了,那接下来继续往下看,呃,分析一下这张表的行还有列啊,每行指代的应该是什么?仍然是一个省对吧?OK,那接下来看一看它的具体字段啊,这里边有一部分是什么呢?有一部分是维度属性,那有一部分呢,是七天的统计值,有一部分是30天的统计值,那OK,那它的行还有列咱们基本上就明确了,那接下来分析分析它的数据状态怎么做啊,分析分析下去了怎么做,是不是应该找到我们刚刚那个1D的表,对吧?那我应该是拿他的30个分区对吧?然后呢,得按照省份分组就行了,对吧?呃,那当然呢,只按照省份分组就不好使了,你得按照谁得按照这一大堆的维度属性分组啊,对不对?那按照这一大堆维度属性分组会影响咱们这个结果的力度吗?也是不会的,对吧?因为一个pro ID后边是不是只对应一个名称一个编码啊,对吧,这个大家理解就行了,好了,那所以说按照这一堆分组跟按照这一个ID分组是一样的啊行了,那分完组之后呢,哎,直接求和能得到这些30天的统计值,那有条件的求和能得到七天的统计,好了,那这样一来咱们就能拿到我们这张表所需的数据了,最终给他来一个因字的就。
06:38
可以了啊,这是咱们这张表啊,行了,完成之后视频我给他停一下。
我来说两句