文章/答案/技术大牛

发布

首页视频04_尚硅谷_Flume_拓扑结构.avi

04_尚硅谷_Flume_拓扑结构.avi原创

2023-01-072023-01-07 00:35:13播放369

点赞0 收藏 0

尚硅谷大数据学科全套教程（总185.88GB）/尚硅谷大数学科--选学技术丰富/尚硅谷大数据技术之Flume/3.视频.zip/4.视频/04_尚硅谷_Flume_拓扑结构.avi

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:00
好，接下来呢，我们说一下这个拓结构啊。刚才说了，我们这么一个一个啊，这么三件，其实它是一个。这个是写错了啊，应该是。那么如果说他是多个这个。是不是可以组成一个串联呢？啊，也就说像水流一样啊，这个数据进来啊，这到然后出去呢，然后到下一级啊，还是这个。啊，上啊。Now China I think。那往往这个中间这个串联的。那这个就也是读这种上，他是什么呢？他叫阿罗。啊，这就是我刚才说啊，比较常用的啊，就在这儿。他用的阿芙罗，阿芙罗呢，它其实是这个对数据进行一个序列化的一个框架。数据信息化还总时候讲了吗啊。啊，自带的，但是这个是更专业的这个数据传输的系列化工具啊，不依赖于任何的框架。
01:08
RBC底层是RBC远程过程调用啊。行，那这是这种策略，那下面再往下看。还这种形式。一个扫帚啊，进来。那这个通道呢，你发现我是不是可以配置多个通道。哎，可以并行配置多通道，那think我也可以配置。对吧，能感受到吗？哎，那我就相当于数据这一块分叉了。啊分把这个书记，哎，这种书据发到这，这个书据发到这，这个书发到这。啊，然后发到as啊，甚至这个又连了一集。那这个分叉呢，这个数据可以是，也就说可以是原数据一模一样，所有的数据来一个备份发到这其实也可以，你可以选择性的控制它。
02:03
啊，空谈什么呢，后面我要讲的。拦截器。拦截下来，拦截了个什么呢头。数据的头，头上有数据的类型，比如说啊，我们日后讲的项目，讲什么项目呢？日志的项目，日志项目有正常的启动日志。还有什么呢？错误日志？还有点击流日志。等等N多种日志类型，但是呢，这个读数据的时候，不管你什么，他都会落盘到这个状态的一个文件里面去，那通通的都读不来。读来之后到这块的时候，哎，要根这个数据进行拦截，拦截之后根据它的分类去传通一啊，比如说这个传通一是启动日志，传二呢是错误日志，三呢是这个点击流日志，这是可以分开的啊，在日后的日志项目中，这块会涉及到。
03:03
那这里是这一块，那再往下。啊，这个呢，是前集一个弧。啊，一个镇的是一个镇的话，一个主家相当于。那没有一级的。哎，是分个多个。将你这个很大的数据拆分成。多个难处理。当然他们的配置不一样啊，什么配置呢？内存的配置不一样。啊，你像你这个前一级的数量很大，那像往往在工程开发中配置多大呢。比如说十个G。那你后后一题的这个这块呢，我要分别处理呢，哎，往往可能是。两个G。或者是四个G啊。啊等等啊，这样就能实现这个效果啊，现在又把这个数据进行一个负债均衡啊。评分。那再往下看这种这种头部结构。
04:02
这是不同的。这个数据源头。这个日日呢，这个这个作品结构，就是我们日后的这个日日项目框架。一模一样啊。而且目前在企业当中，80%~90%企业都这么用的。怎么样了，分析下哈。以前一集是放开的。放开了。Top是有N多个啊，通过安全格式可以把这个日志分别存到这里面吗？去，那这里面的日志呢，哎，你怎么获取呢，你可以通过你的。服务器远程的可以访问这个接口，把它的日志。读过来。没问题吧，啊，这是一种形式啊，当然还有其他的形式啊，它可以通过其他脚本的形式把这数据拷过来也是OK的。啊，但是你这个父母跟这个topd不是在一台服务器上。一般情况下都是这样，除非你这个。呃，机器比较紧张是吧，啊，服务器不够啊。
05:00
大家可以这么考虑啊。那总之前一级业务部门肯定会把你的数据导入到你相应的这个辅助文件夹上。然后第一级。就是用来采啊采这数据。采集数据，这是采，这采采出来之后通过这个符母进行一个聚合。因为你这边前期太多了，如果说都对应着这个ADS，那就是相当于是一对多啊，那这个交互起来这个还是很忙碌的啊。而且比较，呃比较烦对吧，啊，你要是现在变成了一对一。一对一，那同样道理，那一对一这个的配置，它的内存要求一定是很高的啊，往往是十个G以上。那前一级的话，你配置一个G2个G就足够用了。OK啊，这是这块。这是聚合啊，相当于数据的一个集合。

展开

我来说两句

0 条评论

登录后参与评论

作者

腾讯云开发者课程

【合辑】尚硅谷大数据技术之Flume/3.视频.zip/4.视频

（4/20）

6分15秒

01_尚硅谷_Flume_课程介绍.avi

3640

12分25秒

02_尚硅谷_Flume_定义.avi

3490

15分40秒

03_尚硅谷_Flume_组成.avi

3650

6分4秒

04_尚硅谷_Flume_拓扑结构.avi

3690

7分42秒

05_尚硅谷_Flume_Agent内部原理.avi

3600

5分47秒

06_尚硅谷_Flume_快速入门.avi

3630

4分50秒

07_尚硅谷_Flume_监控端口数据官方案例分析.avi

3550

17分14秒

08_尚硅谷_Flume_监控端口数据官方案例实现.avi

3520

3分2秒

09_尚硅谷_Flume_实时读取本地文件到HDFS案例分析.avi

3620

17分38秒

10_尚硅谷_Flume_实时读取本地文件到HDFS案例实现.avi

3750

4分11秒

11_尚硅谷_Flume_实时读取目录文件到HDFS案例分析.avi

3530

12分4秒

12_尚硅谷_Flume_实时读取目录文件到HDFS案例实现.avi

3490

4分11秒

13_尚硅谷_Flume_单数据源多出口案例（一）分析.avi

3730

17分15秒

14_尚硅谷_Flume_单数据源多出口案例（一）实现.avi

3570

4分8秒

15_尚硅谷_Flume_单数据源多出口案例（Sink组）分析.avi

3550

17分7秒

16_尚硅谷_Flume_单数据源多出口案例（Sink组）实现.avi

3560

3分48秒

17_尚硅谷_Flume_多数据源汇总案例分析.avi

3640

11分30秒

18_尚硅谷_Flume_多数据源汇总案例实现.avi

3840

22分42秒

19_尚硅谷_Flume_监控之Ganglia.avi

3580

10分32秒

20_尚硅谷_Flume_企业面试题讲解.avi

3620

04_尚硅谷_Flume_拓扑结构.avi原创

我来说两句

作者

相关推荐

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐