00:00
来我们看第诶32.7.2.3这一个留存率啊,留存率,那大家还能想起来这个留存率是什么意思吗?留存率还能想起来不啊,想不起来,咱们就还是举例子啊,这边就直接举例子,你不用看它描述啊,就直接举例子啊,首先那假如说我们现在6月14号这一天啊,六月14我们新增了100个人,对不对,那六月十四一天之后也就到了六月15了,615,那昨天也就是14号,注意啊,一定得是14号新增的这100个人里边啊,有多少人活跃了,有80个活跃了。啊,这个80指的是15号的活跃用户吗?不是只是活跃用户当中的一部分吧,对不对啊,这个得搞清楚啊好,那这80人啊回来了,那这时候我们就会得到一个值,我们就说6月14号的一日留存用户数是百分是80个。啊,就是等于这个八十八十个嘛,那当然咱们说6月14号的一日留存率是多少呢?80%啊,是不是就用哎6月14号的一日留存税除以6月14号的新增税,那咱们得到的就是6月14号的一日留存率啊,这个搞清楚OK,那随着时间的往后推移,我们来到六月这个十,哎,六号啊,66号啊,这个写的有点难看啊,6月16号啊,凑合看吧,那我们还是14号新增的100个人里边,我有70个人活跃了,对对吧?啊,那这样一来的话呢,我们相当于呃,又得到了一个留存的值,那叫多少呢?6月15号的注意几日了,这次呃,不是15啊,十十十四啊,14啊,十四十四号的几日啊,两日,因为是不是两天之后了呀,两日留存数是百,是70个,然后留存率呢是70%,这就是所谓的留存率啊,然后我们要求的值是哪些呢?看文档文。
01:57
30那的给咱们把这个图画出来了,把这个图看一下啊。
02:01
啊,这个忘了忘了点开一个PPT了,这个比较慢打开,咱们稍微等一下啊。那实际上我们在工作的时候呢,可能会计算的留存会比较多,我们可能会要求大家去计算每一天的一日,两日,三日,四日,五日,六日,七日留存,然后后边呢,15哎,30哎,60哎,会这么去算的啊,会这么去算的啊,那当然在咱们这儿呢,我们没有要求大家去算这么多,哎呀,我就给它宽了啊,没有要求大家去算这么多,我们只需要算几个呢?来咱们算每一天的三日留存就够,就是每一天的123日留存,来咱们看一下啊。这是咱们这个结果啊,这是最终诶我们做可视化展示的时候的这个效果啊,这是做可视化展示的时候的效果啊,我们不是说这个,咱们这个做这个留存需求的时候,大家最终查出来的就是这个结果,你最终查出来的可可以不是这个形式,但是呢,你要有他这里边所需的所有数据啊,可以不是这个形式,这是最终展示的形式啊,来看一下展示的形式,看能不能看明白啊,来看看首先那这个是不是有一个字段是时间呀,对吧,这个时间十四十五,十六十七,然后后边呢,有一个字段叫做新增,哎,用户新增用户一百二百,100,这个新增指的是哪一天的新增。
03:20
拿是不是就是他前面这个日期的新增啊,14的新增,哎,15的新增,16新增没错吧,然后后边呢,有一天后,两天后,三天后,那一天后呢,指的是几号了呀?是不是14号的一天号,6月15号对不对,那这个指的是15号的一天后对吧?应该能看懂啊,那也就是说你需要去计算出来14号的呃,一日留存多少,两日留存多少,三日留存多少,那15号的啊,一日留存多少,两日留存多少,三日留存多少,16号的一日两日三日能理解吧,17号的一日两日、三日,每一天的123日留存我都得求出来,这个大家能理解吧?啊搞清楚啊,这是我们最终要展示的这个效果是这样的,但是呢,我们来看一下咱们文档当中的这个表啊,这个表呢,跟最终展示的这个格式是不一样的啊,咱们以文档当中这个ADS层的表为准,就是大家做这个需求的时候呢,以这个表为准,大家看看这个表能不能看懂啊。
04:20
首先我们大家得明确啊,呃,看一下这个表中的字段吧,咱们先看这个字段,这个字段有什么啊,首先有一个字段叫做create date。是啥?是不是设备的新增日期,对不对,那这还有一个字段叫做retention day。留存天数,这就是留存天数,其实这个相当于就是那个日期对吧,这个就是相当于啥呀,那个几天后的几天对吧,那个几啊好,那下边有啥re count,这是啥?是不是留存的数量,这new mid count是啥呀?是可read date这一天的新增的数量吧,对不对?最后有一个留存率,留存率应该怎么来,是不是用留存数量除以新增数量得到就是留存率啊,能理解吧,这是咱们这张表的结构上面呢,还有一个钻叫做统计日期,这个无所谓。
05:09
啊,这个无所谓,这个到时候呢,我们直接用Dollar do date给它替换就行啊,这个无所谓,好,那我现在把这个字段介绍完了,来,大家现在说一下,那这张表当中一行数据对应的应该是一个什么。他这张表里边一行数据跟我们文档当中这个图的一行的数据一样吗?不一样吧,对不对,你要搞清楚啊,我们这张表当中一行数据指来的是啥,是不是就是一个留存呀。对不对,只有一个留存行数就是一个留存,那我们前面说了,我要想定义一个留存,我必须得有俩定语,哪俩定语一个是哪一天的,那另一个呢,是几日留存对不对?你看这张表当中,我们相当于这这相当于是不是这张表的主件呀,对吧?这是哪一天的。几日留存是多少,没错吧,啊,就是一行数据是一个留存,一行数据是一个留存啊能理解吧?啊好,这就是咱们这张表的这个呃字段,那大家自己做的时候呢,以这张表为准就行了啊那现在大家可能呃看到这个需求之后呢,是不是一点思路都没有啊啊对不对,很正常,这个你需要思考一段时间才可能会有有思路啊,那这时候呢,我先简单给大家那个明确一点啊,大家做这个需求的时候呢,你首先先思考一件事。
06:32
做这个需求的时候呢,首先先思考一件事,思考什么事呢,一定得先思考出来,我们这一天的计算任务应该是什么。啊,因为不光其实不光这个需求啊,不光是这个需求,我们前面所做的所有需求,咱们是不是都得先明确一天的计算任务是啥呀,对不对,只不过前面那些任务很简单,你比如说对于日活活跃来说,那我一天的任务是不是就是计算今天的日活,那新增来说,我一天的任务是不是就是计算当天的新增?
07:06
对不对,那沉默就是算当天的沉默没没问题吧,那留存呢。留存,你这一天的计算任务应该是啥?应市长。啊,我们这大家当然要搞清楚啊,我们这个留存是怎么定义的,是不是定义的是哪一天的几日留存啊,这是咱们定义一个留存的这个定语,那所以说你今天的计算任务到底应该是哪一天的几日留存呀。这是不是大家首先得思考的问题啊,这个大家先把这点搞清楚,然后你再去做就行了啊,一定先把这个思考思考清楚了啊,再重复一下,做这个需求之前,做留存之前,一定思考一下我这一天的计算任务应该是哪一天的几日留存。啊好,那就提示这么多啊,再提示多了就没意思了啊,大家自己做着就没意思了啊好,那到时候大家自己琢磨琢磨啊好,我把视频录一下。
我来说两句