00:00
上节课呢,我们分析了在我们的日志当中,一共有这么多种记录的类型,那每一个记录的类型当中,我们都有很多的内容需要去记录,同时他们还有一些公共的信息,也就是重复的信息,我们需要去处理,那这些信息大家想一想,我们怎么处理它比较合适?如果说我们每条记录都存储的话,那在我们的日志当中就会存储很多重复的内容,它会非常耗费我们磁盘的空间。那我们来看一看我们用户行为日志的格式,它是什么样的?我们的用户行为日志啊,一共分为两大类,第一类叫做页面日志,第二类叫做启动日志,那首先我们来看一看页面日志它是长什么样?页面日志呢?它是以页面浏览为一个单位的,也就是说,一次页面浏览,我们生成一条日志。那大家想想我们的用户啊,在浏览一个页面的时候,他可能在这个页面当中诶,做很多个动作吧,他有可能做了点赞呢,关注啊,收藏评论哎等等等等这么多个动作,同时在我们当前这个页面还会曝光很多个商品,并且呀,还有可能发生一些错误的内容,那这些日志我们都要给他记录在这一条日志当中,那这是我们一次页面浏览日志,那我们来看一看在我们的页面浏览日志当中应该都有哪些内容啊,我把这个日志的格式给它复制出来,复制出来我们一点点的看,TTCTRLC,拿到note派的加加我粘贴,首先我们看一看这个日志的格式啊,是以大括号开头,大括号结尾的,那这个格式叫做Jason,那Jason当中是一个个的KV键值,对的方式存储数据的啊,我们来看一看我们的数据是如何存储的。首先。
01:56
Common,那这个common的内容它叫做环境的信息,它这里啊包括了地区的编码呀,手机品牌呀,哎什么渠道啊,手机型号,设备ID,会员idpp,版本号等等等等这些内容,这些内容大家有没有点熟悉啊,我们来到文档上,你看我点击启动记录,那在启动记录上,刚刚的common当中的信息是不是就刚好对应了我们所说的这些重复的内容,那重复的内容如果呀,我们在日志当中,你看这是动作记容,我动作记录我存储一个这些重复的内容,我曝光记录,我也存储这些重复的内容,那这样是不是我们这一条日志它就会非常非常的大,所以说重复的内容我直接就给你抽取出来一个公共的模块来就完事了。好往下看,第二个叫做action action呢,它代表我们的动作记录。那动作记录我们看这。
02:56
这是一个什么呀?中括号吧,那中括号就代表我们这个动作记录当中,我们可以记录多个动作啊,那我们在这儿只有一个动作,所以说我们就看一个就可以了,那动作记录首先XID,它代表我们当前这一次动作的ID fever是赞的意思,ADD呢是添加,那他们两个加一起就是点赞啊,当前这个用户的动作就叫做点赞。
03:23
再来item ID,那他点赞的是哪一个商品呢?诶,ID为三的这个商品item type类型,我当前这个商品的类型是什么类型,以及TS时间戳我当前这次动作它发生的时间点,再往下来display display它代表曝光记录,那曝光记录你看它也是一个中括号开头,中括号结尾,它就是一个数组,那数组的话它就可以存储多条曝光记录,那我呢,以一条来举例,我们分析一下。首先第一次play type曝光的类型,当前这次曝光它是怎么来的呢?啊query它是查询,是我查询搜索得来的item商品,他曝光的商品是哪一个商品呢?还是item为三的这个商品,以及曝光商品的它是什么类型呢?曝光商品的类型auto tap我曝光的时候出现的顺序啊POSID,我曝光在哪一个位置,什么意思呢?我当前曝光的时候,我有可能诶我先出现了这个商品,我再出现这个商品,那这个就叫做曝光的顺序,曝光的位置搜索,诶它是在搜索页面,那我左边呢,有一些商品的推广,那我在下面还有可能有一些商品的推荐,哎,推荐系统给我们啊推荐的商品我们就可以通过曝光的位置来判断当前的这一个商品它是怎么来的,好,那这个是曝光,那接下来。
04:59
哎,我们再看一看配置,这个配置啊,它记录了我们页面的信息,我们看看都有哪些,首先duration time,我们当前这个页面持续的时间,也就是说我这个用户在我的页面上一共停留了多久,这是一个毫秒值。那同样我当前这个页面它展示了哪些商品呢?你看我展示了一个ITEM3的这个商品,那以及我这个商品它是一个什么样的类型,Item type,那我上页的ID,还有我当前的页面ID配置ID,它代表当前的ID告detail,它是一个商品详情页,以及我当前这个页面它是从哪一个页面跳转来的呢?我们也要给他记录一下,然后我通过上一个页面,还有当前的页面,我可以记录用户他的一个浏览的习惯。
05:55
这儿还有一个source type,我当前这个页面它是怎么来的,页面来源promotion,它是商品推广的意思,那除了promotion,我们还有可能是搜索呀,或者推荐呢,哎,得来的。
06:08
Irow它记录了我们一些错误的日志,你比方说我当前这个页面,哎,访问访问它找不到页面了,404了,那么IR code它就会给我们一个编码,叫做404错误编码,那错误的信息我们也会对应的给出一些错误的信息。它代表跳入当前这个页面的这么一个时间出节点,好,那这个就是页面浏览日志,那说完页面浏览日志,我们再回到文档当中,这儿还有一个叫做启动日志,我们来看一看启动日志它又记录了哪些内容,那启动日志呢,它是以启动为单位的,我启动一次APP,我只生成一条启动日志,那这个启动日志呢,我们给他单独来维护一条日志,那说明呢,启动日志还是比较重要的,我们来看一看启动日志有哪些内容。
07:08
我还是CTRLC给它复制出来,拿到我们的文档上,我给它放到下面啊,我们来看一看。同样我们这儿也有一些公共的信息,那这些公共的信息在启动日志这儿我们也给它抽取出来了,那除了公共的信息,我们这还有一个start start呢,它就代表我们启动的一些内容,我们看看都有啥,首先安全,它这记录了一些启动的方式啊,第一个icon,它代表手机图标启动,也就是说我通过手机上的一些图标APP的图标按钮来启动我们的APP notice,它代表通知,哎,它是我们手机上通知栏啊,你比方说给我们出了一些推广的信息呀,我们点击推广的信息,那么我们的APP也会启动。还有一个star,这个叫做安装后启动,当我们安装完这款APP之后,会有两个按钮,左边呢有一个按钮叫退出,右边有一个按钮叫做立即启动,当我点击立即启动的时候,那这次启动它的类型就叫做。
08:15
Star安装后启动啊,那这还有一个启动加载的时间,我当前这个APP它启动的时候一共花了多久?那为什么要记住这个时间呢?你说有没有可能我这一次启动20秒钟我还没有启动的来,那这能证明个啥呀?是不能证明我这一次启动可能出现了问题了,那是我们APP的问题呢?还是用户他的手机或者网络环境的问题呢?哎,都有可能,所以说我们要给他记录一下广告页ID,我们在启动日志上会有一个广告页ID,这还有一个广告播放的总时长,这还有一个用户跳过的时间点,那我们通过广告播放的时长以及用户跳过的时间点,我们就能知道用户一共看了多久的广告,那根据用户看广告的时间长短呢,我们就能知道用户对这个广告他是否感兴趣,如果说用户对这个广告感兴趣的话。接下来我们就可以给。
09:15
给他推荐同类的商品,那同样在这儿我们也记录了一些IO的信息,错误的信息,那这也有一个TS,代表当前这一次启动日志所产生的时间,好,那这就是我们启动日志。
我来说两句