温馨提示:文本由机器自动转译,部分词句存在误差,以视频为准
00:00
呃,好,各位同学,那给大家留一个这个这个周末的一个小作业啊,啊来,那这个小作业非常简单,我们来看一下这个需求让我们求的市场啊,他让我们求的是新这个用户新增活跃统计,OK,那这个需求呢,一共有俩指标,分别是啥呢?看第一个这个是啥?是最近一期三十日的新增用户数啊,OK,这个新增指的就是新增注册用户对吧?哎,这个理解一下,好,那这个是啥呢?是最近一期三十日的活跃用户数,OK啊好,那这俩指标怎么去理解呢?其实很简单,我们举一个具体例子啊,最近一日的新增用户指的是什么?就是我最近一天注册了多少个用户对吧?OK,那最近七天呢,是不是最近七天注册了多少个用户啊对吧?很简单,那接着往下走,那这个最近一日的活跃用户是指的是什么呢?很简单,就是我最近一天对不对,他的所谓的活跃用户指的是什么呀。就很简单,就是你今天有多少人活跃,有多少人登录了呗,对吧,咱们活跃是按登录去算的啊OK好,那我最近七天呢,是不是就是统计一下最近七天有多少人登录了呀,对吧?然后要注意在统计什么最近七和最近30的活跃用户数的时候,一定要记得干啥。
01:11
驱虫对不对,OK,什么意思呢?假如说有一个人在最近七天里边,那他每一天他都登录了,都活跃了,那我是不是也只能算一个最近七天内的活跃用户啊,对吧?啊,实际上一定要记得去重啊,OK,好,那这就是咱们这俩需求啊,这俩指标啊,完事了之后呢,我们看一下这个最终的建表语句啊,咱们得知道就是最终咱们需要得到一个什么结构的数据啊,来CTR咱们放在这来稍微再看一下,呃,先看一下表名叫做as user states,就是用户的一个统计啊,比较简单,然后往下走看一下这个字段,呃,字段呢,我们先看下面这俩。这俩是不是正好对应那个新增用数和活跃用数啊对吧?这个不多说,然后看上边这俩字段,上面这俩字段其实对应的是什么呀?所就是那个统计周期对不对?OK,那完之后呢,这个re代表的是一七三十,那完了就是最近一天,最近七天,最近30天,好,那么DT指的是什么呢?这个它就有含义了,对吧?它指的是你这个最近N天到底是截至哪一天的,最近N天对不对啊,指的是这个含义,这块大家要给他搞清楚,行了,那问为了验证一下啊,就看大家是不是真正的理解的这个表结构了,那现在问一个问题啊,就是每天我们会往这张表里写入几行数据。
02:20
分析分析。对吧,写着几行啊,是一行吗?几行三行吧,是不是就是三行对吧,我是不是会算出来一个最近一天我的新增用户是多少,活跃用户是多少,对不对,那玩意最近七天是多这个多少,然后最近30多是不是就三行数据对吧?那完了之后,这就是咱们这两边的一个表结构好了,那这个完成之后视频我停一下啊。
我来说两句