温馨提示:文本由机器自动转译,部分词句存在误差,以视频为准
00:00
说一下啊,因为今天到目前为止,咱们的日活呢,就已经正式结束了,咱们开始新的需求对吧?那么如果说想做我们的日活对吧,那么大家呢,首先呢,你得知道说我们现在这个日活到底是干什么的,早就说人人以后说诶你做过实时项目是吧?你都统计过哪些指标啊,你都做过什么事啊对吧?哎,那么首先第一个啊,我们对统计过对吧,当前对吧,我们现在这个网站,它的一个分时日活数对吧,或者统计的一个日活,这个日活下面咱们是不是其实也按照不同的指标进行统计了,比如说我现在对吧,我当前对吧,这个啊,今天的日活它的一个地区分布情况,它的一个渠道分布情况对吧,然后接下来我现在呢,它的一个分时指标,就这都属于我们的个日活,对吧?那么具体的流程什么样的呢?对吧,如果你要给人描述的话,那么首先第一件事,对吧,你们怎么描述,有个加包模拟实时数据是这样描述吗?对吧,不应该吧,对吧,那应该什么应该是。
01:00
我们现在对吧,在我们这个前端,然后呢,有一些我们的日志买点对吧?然后接下来那么这个买点呢,会采集一些我们日志,这个日志呢,主要分两大类,一个呢是我们这个行为日志,一个呢是启动日志,那么这个日活呢,我们主要通过我们的启动日志对吧来获取数据对吧?然后接下来那么我们现在呢,因为对这个具体要处理啊,是我们这个大数据项目组到队进行处理,所以说呢,那我们把这个日志呢接触到之后,对吧?那是我们自己来进行处理的对吧?我们处理的时候呢,我们使用的是我们这个spring boot对吧,来开发我们spring程序对吧?那么对日处理呢,主要是两个操作,一个呢是落盘保存一份,那么另外一个呢,对吧,那我们是保存到或者发送到我们的卡夫卡,它对应的我们的主题中啊,对应的主题里边,那么落盘咱们怎么实现的呢?落盘我们直接使用的是我们对日志支持的框架,我们使用的是log back啊,直接利用我们这个log back。
02:00
来完成落盘,那么我们现在的网卡的话,里边去写的话,我们会根据当前日志的不同类型,是启动日志还是事件日志来把数据呢,写到不同的我们的主题中去,对吧?那么同时呢,咱们在处理我们这个数据的时候,处理日志的时候,对吧?那我们呢,使用NG来做的是我们这个负载均衡,那如果使用NG来做负载均衡的话,那么大概其实我们主要操作的是不是,其实就是我们现在这个配置文件对吧?你想一想,我现在如果要想去操作的话,那么这个时候主要呢,我们操作就是我N这配置文件,对,在配置文件里边,如果想实现负载均衡的话,那其实两个配置,一个是location拦截请求,拦截请求之后呢,咱们通过一个process pass的这样的一个啊,这个参数来指定对吧,那我们现在这个反向代理服务器,然后接下来反向代理服务器通过upstream来指定它到底代理哪些服务器,对吧,然后接来在咱们里边来把这个服务器呢。
03:00
给配置一下对吧,这块呢是到这儿了啊,这个到这儿了,然后接下来那么我们现在呢,要对我们的卡卡数据啊,来进行一个我们的处理,对对卡卡数据进行处理,那么如果对卡卡数据进行处理的话,同学们,那么咱们现在这里干什么,是不是得使用SPA推敏来对我们的卡卡数据,对吧,来做一些操作呀,对吧,那个请一下。
我来说两句