00:00
好,接下来呢,我们说一下这个拓结构啊。刚才说了,我们这么一个一个啊,这么三件,其实它是一个。这个是写错了啊,应该是。那么如果说他是多个这个。是不是可以组成一个串联呢?啊,也就说像水流一样啊,这个数据进来啊,这到然后出去呢,然后到下一级啊,还是这个。啊,上啊。Now China I think。那往往这个中间这个串联的。那这个就也是读这种上,他是什么呢?他叫阿罗。啊,这就是我刚才说啊,比较常用的啊,就在这儿。他用的阿芙罗,阿芙罗呢,它其实是这个对数据进行一个序列化的一个框架。数据信息化还总时候讲了吗啊。啊,自带的,但是这个是更专业的这个数据传输的系列化工具啊,不依赖于任何的框架。
01:08
RBC底层是RBC远程过程调用啊。行,那这是这种策略,那下面再往下看。还这种形式。一个扫帚啊,进来。那这个通道呢,你发现我是不是可以配置多个通道。哎,可以并行配置多通道,那think我也可以配置。对吧,能感受到吗?哎,那我就相当于数据这一块分叉了。啊分把这个书记,哎,这种书据发到这,这个书据发到这,这个书发到这。啊,然后发到as啊,甚至这个又连了一集。那这个分叉呢,这个数据可以是,也就说可以是原数据一模一样,所有的数据来一个备份发到这其实也可以,你可以选择性的控制它。
02:03
啊,空谈什么呢,后面我要讲的。拦截器。拦截下来,拦截了个什么呢头。数据的头,头上有数据的类型,比如说啊,我们日后讲的项目,讲什么项目呢?日志的项目,日志项目有正常的启动日志。还有什么呢?错误日志?还有点击流日志。等等N多种日志类型,但是呢,这个读数据的时候,不管你什么,他都会落盘到这个状态的一个文件里面去,那通通的都读不来。读来之后到这块的时候,哎,要根这个数据进行拦截,拦截之后根据它的分类去传通一啊,比如说这个传通一是启动日志,传二呢是错误日志,三呢是这个点击流日志,这是可以分开的啊,在日后的日志项目中,这块会涉及到。
03:03
那这里是这一块,那再往下。啊,这个呢,是前集一个弧。啊,一个镇的是一个镇的话,一个主家相当于。那没有一级的。哎,是分个多个。将你这个很大的数据拆分成。多个难处理。当然他们的配置不一样啊,什么配置呢?内存的配置不一样。啊,你像你这个前一级的数量很大,那像往往在工程开发中配置多大呢。比如说十个G。那你后后一题的这个这块呢,我要分别处理呢,哎,往往可能是。两个G。或者是四个G啊。啊等等啊,这样就能实现这个效果啊,现在又把这个数据进行一个负债均衡啊。评分。那再往下看这种这种头部结构。
04:02
这是不同的。这个数据源头。这个日日呢,这个这个作品结构,就是我们日后的这个日日项目框架。一模一样啊。而且目前在企业当中,80%~90%企业都这么用的。怎么样了,分析下哈。以前一集是放开的。放开了。Top是有N多个啊,通过安全格式可以把这个日志分别存到这里面吗?去,那这里面的日志呢,哎,你怎么获取呢,你可以通过你的。服务器远程的可以访问这个接口,把它的日志。读过来。没问题吧,啊,这是一种形式啊,当然还有其他的形式啊,它可以通过其他脚本的形式把这数据拷过来也是OK的。啊,但是你这个父母跟这个topd不是在一台服务器上。一般情况下都是这样,除非你这个。呃,机器比较紧张是吧,啊,服务器不够啊。
05:00
大家可以这么考虑啊。那总之前一级业务部门肯定会把你的数据导入到你相应的这个辅助文件夹上。然后第一级。就是用来采啊采这数据。采集数据,这是采,这采采出来之后通过这个符母进行一个聚合。因为你这边前期太多了,如果说都对应着这个ADS,那就是相当于是一对多啊,那这个交互起来这个还是很忙碌的啊。而且比较,呃比较烦对吧,啊,你要是现在变成了一对一。一对一,那同样道理,那一对一这个的配置,它的内存要求一定是很高的啊,往往是十个G以上。那前一级的话,你配置一个G2个G就足够用了。OK啊,这是这块。这是聚合啊,相当于数据的一个集合。
我来说两句