- 00:01 - 好,那第二块的一个内容我们就已经搞定了啊,直接这个PPT呢,其实我们稍微看一下这个PPT也不用看了,其实就是这个意思,诶去走走,然后优先级高的是不是第一个对吧?啊先从他发,假如说他挂掉了,是不是这条线。就会没了呀,对吧,这条就没了,那就要选用他来发了吧,啊,他来发了就这意思,那中间呢是这是故障转移的,故障转移的里面一个内容,那个附带均衡的,好像就没有画那个PPT了,没有画PP的,因为它里面改的东西我都没有去文档当中去摘嘛,你可以从文档摘啊,这个都OK的啊,这个都OK的,嗯,注意如果说。就是你要关注一下,就是这个点你最好干什么呢?把文档当中粘出去,放到那个什么这种没有格式的这种文件里面,看一眼它的分割符,要不然就很有可能之前不是那个什么忠告出错了吗?其实我这是没问题的,因为我加完之后呢,都会直直接干什么呢,复制,然后做一遍测试是没问题的。 
- 01:01 - 啊,没问题的,因为这个是从我们测试的案例当中粘过来的,然后去复制回来,这样做的好,那接下来呢,我们就看一下这个聚合。聚合那聚合案例我们看一下需求啊,同样的看一下需求这个里面呢,是这样的。哈,102监控某一个数据。group.log啊,这个数据这个文件名无所谓吧,对吧?啊,假如说我们还用那个什么哈,点logo啊,这个都无所谓啊,或者呢,监控一个端口都可以啊,监控一个文件啊,监控一个文件,这个呢,文件名我们随便等会呢,再造一个还是放在data底下吧,假如说我们这个呢,测试呢,我这次呢,还是放在data底下啊,就保证这个数据,因为数据放在哪无所谓的啊,就是一个路径问题,好接下来是这个点。在哈多宝103上面起一个弗尔了。注意跨机器了,看见没? 
- 02:00 - 对吧,因为一定要讲一下这个在生产环境当中,我们说的就是后台服务器跟大数据集群是分开的,是不是会涉及到这种跨机器,对吧?刚才我们测试的组案例都是在同一个102上测试的啊,那之前我们还聊的那呢,是一个分布式的,那分布式体现在哪啊,就是这种跨机器吧?啊,幺零二幺零三都是生产数据源。对不对,对吧,一个是本地文件,一个是端口数据,那这两个source,一个就是我们所说的。Tell DR这个就是。NEKNC对吧,NC作为两个数据啊,那中间China呢,用memory。Single。Single对吧,啊,应该乘了第二层,好,那我们看一下,接下来是F蓉一跟F2将数据发给。哈,多宝104上的F3啊汇总嘛,不是聚合吗?对吧,就像我们说的生产环境当中,后台呢,有很多的一个机器,然后我们是不是要把很多的机器说直接操作啊,这D的这样不好啊,我们是不是要给他做一个。 
- 03:10 - 聚合对吧,啊,这个聚合,那我们这个测呢,也没必要说非得搞个上百台机器吧,两台机器一样的能做了,是不是上百台都一样的对吧?啊都一样,因为两台跟上百台只是数量级上的一个问题,发送到104,最终在三上,也就104上将数据呢打印到控制台,因为打印到控制台还是更方便我们做测试对吧。啊,因为直接可以看到结果,直接可以看到结果,OK,那这个地方要注意的一个点就是跨机器的问题,我们之前提到了一个点。阿波罗,Think跟S在通信的时候,它是不是基于客户端跟服务端的这种通信机制?我们当时开的时候是不是说直接先开前面,前面是不是C。还有印象吗?开C的时候他报那个什么端口连接不上,是不是有这个问题,但大家看看日志吧,那。 
- 04:02 - 也就是说think这边是属于。客户端这边属于服务端,好,那问题就来了。因为是这样的,你现在是102103发到104。那问题来了,就是我到底是写102,就是说这个数据我发的102的4141端口。我103发到103的4141端口,你104在里面配一下,配两个S,你自己到我102103上来读,还是说我给你发送到104的某一个端口。然后你自己104上面自己来什么该端口来读。是不是应该发送到104,因为你想一下这边是启动的是服务端,你有见过哪个服务,诶这个服务进程在102上面,最后用的是103的端口,有这种服务吗? 
- 05:03 - 你有见过这种服务吗?但是你一定见过这样的一个东西,就是这个服务,买服务装在linus上,但是我用Windows通过3306的端口去连接这个服务,是不是这样的一个操作?也就客户端可以是远程的,能理解这个事儿吗?但是服务端你说我102上企业订购的,不好意思,我用的是你103的9000端口,能这样用吗?不可能吧,也就是说这个服务端口要干什么,在这个机器,也就最终我们的配置文件要发到什么。104能听懂这个意思对吧,之前我们就说让大家记住一个点就是。Source这边是什么服务端对吧?啊,那think这边呢,是客户端,你客户端可以跟远程的服务端进行通信,对吧?服务端没有没有说一个服务,我在102上起个服务,然后用的是103的端口嘛,没有这种吧,啊用不了啊用不了这个注意一下,所以呢,它是基于这种客户端跟服务端的一个通信机制,所以这一块配置呢,因为有区别,你跨机器了,跟刚才不一样。 
- 06:08 - 我无论哪个是服务端客户端的问题,反正我写的都是102。大家都一样嘛,同一台机器嘛,所以你不用考虑这个问题,但是呢,我通过刚才之前的启动告诉大家了,这个问题能听懂啊啊,那整个的需求我们搞定了,也就是说刚才等我这个配置文件里边要注意一下,就这个两个里边绑定的S要写104。能听懂吧,啊要写104,因为你是属于我们所说的客户端,客户端呢能远程连接。对吧,啊,能远程连接到服务里边,这个是没问题的啊,这个要注意一下,好之后呢,是这个PPT我们看一下啊,这是也是关于我们整个需求的一个PPT啊,我们快速过一下。第一个我们要做的是就是干什么的呢?一个是102上实时更新的一个文件啊,一个是103上面实时更新的端口数据,我们现在希望这两个都到104的什么。 
- 07:06 - 控制台上面去打印,或者呢,你希望这两份数据都到什么HDFS,对吧,生产环境当中不是说打印到控制台了,控制台我们做测试,因为你能打印到控制台,你说写到HDFS,只要把那个think替换一下了啊,整个数据流通了,S替换一下就OK了啊就OK了,好,那接下来这个中间第一个。至于你用的是eec sa还是跳电压,是不是都可以啊,反正是测试环境对吧,如果注意生长环境当中用什么。第断点续传对吧,好断点续传的一个功能,OK,那接下来的single那第二个。加阿芙罗的一个,对接上阿芙罗的一个。So。对接上阿罗的一个搜索,然后什么。绑定到拆控制台,我们这块是不是用了一个,甚至你可以这样。 
- 08:02 - 啊,这一块呢,你不是发到104的某一个端口吗?对吧,这一款一个SS的前提是你发到同一个端口。你如果说用4142,你得用什么4142,我可以做这个事,我他呀,我发到。4141,他发动了4141,那这块你就要用两个sources来接收,然后绑定什么一个China,这个也可以。啊,这个也可以,等会儿呢,我们可以带着大家去测一下啊,这个无所谓啊,这个无所谓就是在这里边,因为我们看到整个配置文件里边是不是可以写一个SS可以有多个S啊多个S,那我们在最后绑定的时候,我们把S1跟S2都绑定到什么。C1上面对吧,那这样就实现了是我们现在的这种功能了,两个呢,我们都带着大家去测一下了啊,这个不用担心啊,这个呢是我们整个的一个内容,最后呢,M到log应的控制台,也就是说启动F3的时候是不是要加杠D这种操作。 
- 09:01 - 对吧,啊,因为是log,什么think啊log think那这两个东西呢,就不用管OK啊,这个是我们整个的一个需求啊,里边最关键的一个点就是我们说的主机零如何配比的问题,你要把握一下这个。 
我来说两句