00:00
好,接下来呢,我们进入到了这个DWS层,对吧?啊DMS层,呃,进入到DWS层呢,首先呢,我们先来做一些前期的准备工作。呃,介绍一些业务术语和分析指标过程当中需要用到的一些函数啊,属于一些前置基础哈,因为到了这个DWSDWT以及这个ADS的时候呢,呃,我们用到了,就是真正的去添天你们所说的这个写色口了啊,写色口哈,呃,这个在企业开发的时候呢,也是。呃,用到的人员啊,是最多的一个岗位,你像前期这个大架构,比如说准备到这个DWD层进行维度的一个建模,这种不是所有人都能参与的,嗯,在公司呢,你至少是一个类似于这种架构师的级别,可能才会涉及到前面数据的一个处理,到了后期的话,你们做的最多的就是DSDFT啊,通过这两层去分析对应ADS层的一些指标哈。好,那我们来看首先第一个业务术语,那业务术语呢,啊,主要是业务,看大家这个能不能理解哈,首先在这个大数据平台当中,什么叫用户,什么叫用户,有同学该说了,用户还不懂对吧,就是来到这个呃电商商城呃,登录的这个一些用户呗。
01:20
哎,其实呢,稍微有点出入哈,我们来看一下啊,什么叫用户,用户呢,是以设备为判断标准的。啊,这个用户呢,我们是以这个设备ID为判断标准的,好,那在移动统计当中,每一个独立的设备认为是一个用户。每一个独立的设备是一个用户,比如说你有一个安卓手机。他只要一登录,那它就是一个你有iOS啊,这个手机那一登录也是,那还有呢,你有平板再登录,那它也是独立的用户。为什么是这样呢?因为啊,像这个安卓系统,根据这个IMEI号。
02:01
类似于身份证号的,它代表了每一台手机都有自己独立的这个I'号。每一个都不一样哈,每一台都不一样,全球为统一,统一编码,全球所有的手机厂商统一编码,每一个人的这个IMEI号都是不一样的,只要你一登录,一访问,直接能够定位出来你是谁,嗯,好,那在之后呢,IOS系统它也有一个叫open u did来识别,是一个独立的用户。每一部手机就是一个独立的用户。是这么一个定义的,有同学说了,那我就有一个苹果苹果手机,我又有一个安安卓手机,那我分别在这两个里面去登录了这个京东,他会给我进入几个用户呢?哎,你要从设备ID这个角度来说,他就会给你的记录是两个用户。啊,这是没有任何问题的啊,这叫用户的概念,它区分于我们后面有个叫会员。啊,我们统一会把这个后面这个会员啊,认为是登录以后的账号。
03:03
那如果是登录以后的账号,你像你这个,像刚才这个小明他安卓登录了,我又拿这个iOS也是登录了自己同一个账号,那对不起,那这是一个账号,这叫一个会员啊,叫一个会员。哎,只有你登录了之后,我才知道你是不是一个会员。你没登录的话,那谁知道啊,对吧,也许你你拿这个安卓手机是你拿的,那还允许还是我拿的呢。嗯,他也不知道是谁谁,那他的唯一办法呢,就是只记你的硬件设备这个唯一ID,唯一标识。定位出来你是哪个用户啊。这是用户的一个标准定义哈,按照设备ID去定义。那下面呢,如何来统计叫新增用户,他又是怎么一个概念呢?新增用户呢,属于这个手持联网使用的应用用户。这第四,如果一个用户首次打开APP,那么用户定义为新增用户。
04:02
卸载再安装。这种不会被算作一次新。啊,新增用户包括日新增,周新增,月新增啊等等,那这个啊,我不知道大家一个一个有没有生活体验哈啊有的时候在这个大街上走了走着的时候,哎,突然一个小妹子是吧,来扫码,扫码送你一个礼物啊,扫码送你个化妆品,扫码送这送那啊这个呢,就是扫完码之后,你就发现你要下载一个APP。哎,只要一下载OK。他这个呢,这个推广的人员,他就得到了一个新增用户。他可以跟他的老大去要钱去了,对吧?啊就可以老大要钱去了。然后呢,你领到了你相应的礼物,但是呢,你的特点呢是诶打开之后礼物到手直接秒删对吧?啊直接卸载了。你卸载了,它也会在他的系统上给你记录上来,你是一个新增用户。啊,就是这个特点哈,就是说新增用户不管你卸不卸载,只要你首次登录了,他就能记录上来,因为他记得谁呀,记得是你这个号啊,因为你的任何一个手机都有你的唯一的一个这个标识。
05:09
啊,V的标识,只要你登录过,那就是一个新增用户,OK。呃,在之后呢,叫活跃用户。什么叫活跃用户呢?打开应用的用户即为活跃用户,不考虑用户的这个使用情况,每天一台设备打开多次会记为一个活跃用户,什么意思?你像咱们这个手机每天打开卡,微信早上一启动对吧?那就说明你是今天微信的一个活跃用户。就这么简单,当然了,你在一天当中可能反复的去开启这个微信,那也会记录一次。只记住一次啊,这一天吧,一天的活跃次数吗?啊,这一个用户的活跃次数啊,活跃了一次,这呢就是这个活跃用户的一个统计,相当于是只是登录就行了。啊,只要一打开那就OK,那这个大家是不是会有那种理解说这个老师我这个手机,我这个微信我一直没关过呀。
06:08
那是不是他每天都认为我是活跃的呢?哎,这里面其实它这个个别应用啊,它有些特殊处理,就说你这个应用多长时间不操作。他认为你退出。就是多长时间,假如说一个小时。一个小时没有对微信任何一个操作,他认为你这个用户已经下线了。啊下线了,比如说这一天我都没有去操作这个这个微信,但是昨天就是昨天啊,昨天的时候这个微信呢,是打开状态没有关闭,但是今天呢。我一点也没操作。但是我我也没去操作关闭它,那算不算今日活呢。啊,70就不可以刷了。啊,如果严格一点就没就可以叫做不算,为什么呢?因为你这里面没有真正的应用它。我们希望统计的这活呢,是能够看到这个用户啊,在这个网站上浏览什么东西啊,啊干了什么事啊,啊是这种活跃哈,好,那在最后周越活跃用户。
07:08
是按周,这一周内有多少用户活跃了,这一个月内有多少用户活跃了,那这就简单了,对吧,只是统计的周期由原来的每天换成了这一周,也就是在这一周内,只要他有一次。啊,活跃那就是活跃呗,啊,那月也是一样的,这一个月当中,它只要有一次活跃,那它就是活跃啊,就这样哈,啊,那再往下呢,是这个越活越累,叫越活越累。一涉及到什么什么率,记住了哈,后面你们统计指标的时候会也会给大家讲,一涉及到什么什么率,就是谁除以谁的问题,就是两个数相除。那这里面就是月活跃用户除以截止到该月累计的总用户什么意思,你可能啊,现在你这个电商网站总注册用户2000万。对吧,有这种可能吧,啊2000万,那么本月有多少个用户活跃了呢?你是在这2000万当中有多少个用户活跃了。
08:06
假如说100万。哎,那它的月活跃率就是当前月的100万除以总用户2000万。啊,就是这样一个值哈,1/20。哎,1/20好。再往下呢是沉默用户,沉默用户呢是指用户仅在安装当天启动过一次,后续时间不再启动行为。该指标可以反映新增用户的一个质量。和用户P的匹配程度。什么意思,这个就还是我刚才举那个地推那个例子啊,你说小妹妹找到你说扫码。扫完码之后,然后领礼物。啊,你们特点安装上之后秒删,那你这个叫新增用户的质量呢就比较差。啊,新增用户的这个质量就比较差,那么其实这次推地推的这个,从这个老板的角度来说,那就是一次失败的一个推广,为什么失败啊,既给你送了礼物,然后呢,这个推广人员又自己领了钱,只有唯一的是老板什么也没没领到。
09:09
因为老板希望的是你这个用户留下来,然后呢购买商品产生价值,然后老板挣钱,那结果呢,是赔了富人又折兵,对不对啊,把这个礼物也给了,然后这个推广费我也花了,结果呢一个用户没带。啊是这样的哈,所以说这个沉默用户啊,也是这个老板非常关心的。啊,非常关心的,他不希望有更多的这个成名用户,都希望是活跃的是吧。
我来说两句