温馨提示:文本由机器自动转译,部分词句存在误差,以视频为准
00:00
好各位,那现在我们再继续往下看啊,呃,下面这张表呢,我们称之为呃交易域用户力度,然后呢是支付最近一日汇总表,那大家可以琢磨琢磨,你说这张表将来存的应该是什么样的数据啊。你你想啊,把支付这张表对吧?那么到最近一天的明细拿过来,然后呢,汇总到用户力度,你得到的数据应该是什么样的,应该是每个用户对吧?在最近一天里边的,诶,支付的总次数,总件数,总金额吧,对吧?应该是这样的一个逻辑啊,行了,那现在我们把它的建表语句,还有数字状态语句拿出来看一下,CTRLC,呃,首先我们还是先来过一下它的这个表结构啊,表名先看一眼,叫做dws trade的交易域,然后是user pay user是不是就是那个用户的力度啊,对吧,Payment就是业务过程,然后呢,最近一日会同样好,那现在继续往下看,看一下它的这个表结构,行和列就行了,分区就不不重复了啊,行,一行是一个用户,那列呢,User ID,再加上最近一天的支付的次数,支付的件数,支付的总金额,诶就是这些东西也比较简单啊好,那现在呢,我们来明确一下它的数据装载应该怎么做,同样会区分一个首日和每日,这个circle我就不看。
01:16
看了啊,咱们还是自己想象一下就行了,想象一下他应该怎么去写这个状态语句啊,咱们想一遍就相当于写了一遍了啊哎,想一下怎么做是不还是找到与之相对应的那个明细表,这个应该找支付那张表对吧?呃,当然说的准确一点,应该是支付成功的那张表啊,找到那张表之后呢,首先第一天我们需要拿全面数据,按照用户再加上日期进行分组,对吧?哎,然后再进行聚合,聚合完之后呢,我们来一个动态分区,那就搞定了,这是首日,那每日的时候怎么做呢?诶,应该是找到明细表对不对?然后呢,只拿是不是一天的分区,然后呢,按照用户进行一个哎分组聚合,聚合完之后把结果写到十五二分区是不是就完事了对不对,OK,就是我在这么说的时候,大家应该能想象到这个词和咋写吧,应该是没问题啊,这个都比较简单啊,行了,那这就是它的一个数据状态,行了,那这个ED的表咱就搞定了,那它有没有对应的ND表呢?来咱还是去找一下,先找一下派升指标,呃,找到我们刚刚的这个ED的派升指标啊,应该是什么力度,咱们。
02:17
是用户力度没问题,然后呢,是什么业务过程,是支付的业务过程啊,然后咱们统计周期,刚才是哪个是这个最近一日,对吧?那这有没有ND的,有对吧?有所以说我们应该是理论上会有一个与之相对应的ND表了,来咱们去找一下啊,往檄翻,往檄翻找到与之对应的N地表,是不是就是这张表啊对吧?来,那现在呢,我们把这张表拿出来,咱们熟悉一下它里边的大致的内容就行了啊来拿过来吧,好,那首先我们先来明确一下它的表明,表明叫做DWS交易域用户力度,然后呢是payment payment是不是就是那个支付啊对吧?然后这是ND最近N天汇总表,行了,那这个过了啊,那接下来看一下它的行还有列,呃,行呢,首先每行这还是一个用户对吧,那列会有哪些信息呢?一个就是UID,然后再有呢,就是七天的这个支付相关的统计值,还有最近30天的支付相关的统计值啊,这就是它的具体字段啊,也比较常规,没什么特殊的啊行了,那现在我。
03:17
我们再来分析一下它的数据状态怎么做,来自己再想象一下它的数据状态怎么做,动动脑子啊,就是大家得动脑子啊,要不动脑子就该走神了啊嗯,想想,想一想怎么做,是不是还是找到与之对应的那个1D表对吧?拿拿多少分区30对吧,30分区,然后呢,直接求和是不是能得到这几个值对吧?完了之后呢,有条件求和能得到这几个值对吧?其实比较简单啊,那还是这么个逻辑,我就不再重复了,行了,那这个完成之后,咱们把视频停一下啊。
我来说两句