00:00
欢迎大家继续收看上硅谷的Linux云计算视频,大家好,我是万洋老师。上节课呢,我们已经把我们的那给构建完成了,对吧,那这节课带大家去添加我们的监控主机的配置方式。那首先我们先打开我们之前构建的环境,对吧,这里都没问题了,诶这里报了一个我们的邦尼信息,告诉的是什么403。那原因是什么呢?它现在监控的是我们本机目录下,目录下的3W目录下的HTHTMM目录下有没有主页文件。因为我这里的主页文件,我们是不是放在我们的u logo下的note下的下目录下,所以这个目录下目录是没有的,那我为它添加一个,我们看一下还有问题吗。好。那这样的话,我给我们的默认的目录下添加了一个index HTML,相信这一会就会变成我们的OK状态了,我们先不管它了,对吧,好。
01:00
那。我们要去监控一台主机的话,我们要知道怎样去定义它的监控方式,所以先带大家去看一下我们拉过的目录的。呃,每个目录的内容以及它大概的含义。不然的话是没办法进行很好监控的,对吧,还是比较费事的,首先我们先在log u logo下的拉目录下,我们先到它的安装目录下,会看到这么几个目录,对吧,一个一个给大家介绍。第一个并存放我们的秘密目录的,没有什么好解释的,对吧,我们现在下一个ETC,好etcd呢,存放的是我们的一些配置文件,一个一个给大家去讲,对吧,第一个CG。跟我们的一些我们的编程接口有关的,我们这里调用不到。H password USS。那这个是我们之前去构建的这么一个阿帕奇的认证的用户文件,对吧,好。SCFG的主配置文件,我们可以打开看一下。指定了我们的日志的存放,对吧,日志的存放。
02:04
定义了我们的一些监控的配置文件,把它链接进来了,那这些监控的配置文件呢,等会我们再去说明对吧,这里我们先不看,那下一个呢,监控的一台local house的CFG。也就是通过这个配送文件定义了我们要监控本机,以及监控本机的哪些资源,都是在这个这个文件中去定义的。并且把它链接进来了,也就意味着其实我们要去监控一台主机的话,我要先写一个类似这样的配置文件,再把这个配置文件加到我们的这个主配置文件,让他去引用,才可以被监控到。如果你觉得这样,比如我有100台,那你站在这里是不是要引用100行比较费事,对吧?所以底下给了我们的一个叫什么CFGD。也就意味着我把这100个子配的件都放在这个目录下,我们只要对这个目录链接进来,这个目录下的所有的CFT都会被连接进来。这样的话是不是更简单啊,对吧,好。那后面放的是我们的缓存,缓存的目录,因为我们刚才是不是已经说过了,对吧,对于我们的na来说,他们并没有把数据写入到数据库,那通过什么去存储数据呢?就是缓存对吧,缓存。
03:16
这里指定的是我们的一些。动态的对象配置文件的指定目录。那我们都是不需要去更改的,以及我们的。Resource,也就是我们的语言配置对吧?以及我们当前的状态数据,以及定义的一些我们的更新时,更新时长,以及我们指定我们的运行的身份。以及主。还有就是我们检测的命令的调用返回值对吧。好,以及我们的卡的命令的接口值。那讲白来说,后面都是一些我们不太重视的这么一些参数了。好,我们先退出。那比较重要的就两点,第一个就是我们链接的CFG的子模板,对吧,好。我们再看下一个。
04:01
Object。Object的本名是对象的含义,对吧,我们到对象目录下看啊,这里的有一堆文件,就是我刚才说的,我们等会在看的一些文件。Come on的定义的是我们这个命令。怎么去调用呢?我们找一下来看一下。我们再熬个比较简单一点的,给大家讲一下用法好。这里定义一个命令,命令的名称为check host live,也就是我们的主机是否还存活对吧?那使用的命令在DOLLAR1DOLLAR一下。这个就是我们所谓刚才给大家提到的这么一个红。那红的配置文件在哪里呢?我们去引用一下,我们到u logo下的logs目录下,再到它的ETC目录下,再到它的当前目录下,是不是有个叫resource cfg。还记得吗?我们刚才给大家提过了红,对吧?打开result cfg我们往下看。他说,这里我们允许最大定义32个,32个。
05:02
这个红代表什么含义呢?相当于就是变量。只不过这个变量应用在我们的NAS的所有配置文件中都是可以生效的。这里默认已经定义了第一个环境变量了,叫。到了有二一到了。那它在USR local下的S下的lab e目录下。后面就没有采用了,对吧,都是注释的,那我们就把这个目录给复制一下,我们进去看一下,这又是什么。好。打开这个目录,你会发现有一堆的check X y z,这是不是就是我们之前所说的它的脚本的命名方式对吧?那也就意味着这个目录是脚本的命名方式,下面有个脚本叫切割PIN。杠H返回的是Dollar host address,也就是我们的返回的是赋予它的这么一个主机,对吧,主机的这么一个变量。杠W代表war。3000。80%。
06:00
三零延时80的可用率对吧,代表汪级别。5100。那代表的是什么?也就是我们的严重警告级别警告,严重警告那如果超过他了呢。也就意味着这里已经出现一个阀值了,对吧,比如我们三天80%和。五千百分之百。80%以下的代表什么OK?两个中间的。代表什么?到他了代表什么?嗯。那这里会出现一个发式,比如80和100对吧,三千八十和5100。80以下的都是我们的,OK。到80以及100之间呢,我们叫什么。
07:01
王,对吧。那100以上呢。Critical。或100和100以上对吧,这应该打一个十星点。然后呢?如果这台主机被失联了呢,就是联系不到了,就是我们的对吧,杠P我们的重置次数,好,这个就是我们定义一条命令使用的这么一个文件。退出,那我们再看下一个contas,也就是我们再去监控的时候,它需要去指定的一些配置方式,对吧。定义了什么?我们的名称为me,对吧?这是不是就是我们的管理员啊,也就是我们最近在通过我们的IP password需要去固定生成的这么一个文件名对吧?User使用的模板generate contact,也就是我们的一般监控对吧?别名以及我们的email邮件。那底下是不是还定义了一个主,主为艾德命主阿利别名以ma斯,成员为纳斯德命只有这一个成员,对吧,好。
08:00
定义的是我们的一个权限文件,监控的权限文件,然后这里又定义了一个叫logo house.cfg,那这个是不是就我们之前所说的这么一个。监控本身主机的配置文件了。Host定义了一台主机。又是使用了一个模板,Linux server模板。那我们再去打开这个模板,看一下在哪里。首先到your local下的目录下。再到ETC目录下。再到object对象目录下。打开。我们的模板配置文件。他们。好,我们搜索一下他的Linux server。这里是不是已经找到了,因为有这个主机模板在这里,它才可以去调用,需要大家注意一下这里使用的主机模板怎么定义的。使用呢,我们的其他一个子模板去嵌套的对吧,子模板叫general host一般监控对吧,然后呢,七十七十二七十二十四小时对吧。
09:07
然后呢?检测时间为五分钟,对吧。一分钟尝试,重新尝试。然后呢,最大次数为十次,对吧,使用的命令叫千host alive。那以及一些其他的一些我们的认证权限,没有什么太重要的东西,那在这里呢,我们就直接回过来,你唯一需要注意的就是这里采用的这个模板,在我们的这个temp里必须要声明到。那接下来我们继续往后看。House name指定的是我们当前的主机名称啊,历是别名,这里需要注意一下,主机名称是我们可以在。拉的这个页面里可以显示出来的这么一个主机名称。那这个别名不具有任何含义,仅仅是当别人打开这个配置文件的时候能够看到的名称,仅此而已啊,Address也就是固定哪台机器的还是非常重要的,对吧?
10:04
然后呢,底下呢,又定义了一个host group组,这里需要大家注意一下。在我们的Linux里。不定义组,也就是我们只定义主机和我们的服务是可以的,但在Windows里,在这个版本下不定义我们的Windows主是会报错的,需要大家注意一下。那再往后看,定义了不同的服务,对吧?熊的模板是local service。主机名称log house的要与上面定义的主机相匹配,对吧?然后呢?此外description,也就是描述信息服务,描述信息为P。兄长的命令是切个屏。当100延时20%丢包率的时候警告,500延时,60%丢报率严重警告对吧?好,又定了一个服务叫什么parting,也就是我们的root的跟风区对吧?好。那检测20%的时候警告,10%的时候也能警告,这叫剩余空间警告对吧,以及我们当前的登录的用户数。
11:02
当年用户数为20人的时候警告,50的时候严重警告,以及我们的当前的主机进程对吧,二百五警告,400严重警告。直到我们的超时,以及我们的三个的平均负载率,对吧,平均负载率。以及我们当前的swap的剩余空间。这个相信大家都应该能看到了,不需要重复去读了,对吧,以及检测我们的阿帕奇夫。好,那也就意味着在这里其实我们就可以去添加以及删除,去达到修改我们监控服务的目的了,那我们再退出,我们继续往后看。下一个printer。监控的是我们打印机的,对吧,我们有启用也现在也用不到了,对吧?Switch交换的这个我们已经见到过了,对吧?好,我们再看下一个。定义我们的监控时段的,对吧。建议我们建筑时段如果是24乘七的话,是怎样定义呢?看这里是这样定义方式,对吧,周一到周天。
12:03
每一个时间采用的时间方式。底下是不是又定义了一个,也就意味着如果我告诉他是24乘七的话,代表的就是。这里是不是说明了72小时对吧,一周的七天的24个小时。那这里是不是定义的是我们的工作日啊,对吧,好,那我们就直接退出。定义我们的时段编那以及Windows c fg给了我们一个Windows的监控模板,对吧?我们现在还用不到,我们先退出,就是object的目录下能够看到一些东西。那这个目录下的内容我们就已经介绍完毕了,我们再到下一个叫include目录。这个目录下为空,对吧,我们就先跳出加载了一些头文件,这里没有用到,然后呢,Lab e ec我们刚才也见到过了,对吧,里面就存放的是我们的。存放的是我们的一些check脚本对吧,以及破模块的存放位置。管理员能够用到的命令下放的是什么?
13:02
是不是就是我们的网页文件啊,在一开头的时候,我们是不是就已经说过了,对吧,网页文件好,以及我们的哇放的一些动态数据,包括日志都会在这里。那这个就是我们的所有目录的这么一个简单的概述了,没有给大家讲的太详细,原因是什么。其实讲的太详细,没有什么含义,我只想给大家简单的去分析一下我们纳入者的一个目录顺序以及关系。因为现在真的对拉者来说已经。属于一个老家伙被淘汰的东西了,那为什么还讲?还是那句话,就是想让大家简单的去看一下,别人问的时候,你能简单的提出你的观点即可。等会我们后面的章节去讲Z式,以后你就知道了这个东西到底有多。怎么怎么样是吧,并不是说它不好,但是时代确实更新了,我们要接受进步,对吧?好,那接下来呢,我们去把。呃,那S监控一台我们的Windows主机,对于Windows主机来说,我们需要去安装一个软件叫NSC加加在这里。
14:07
NS加加这个安装方式还是非常简单的。64的就下64版本,32下32版本,对吧,MSI是Windows专门的安装方式,安装文件的方式。我们可以双击。下一步同意他的协议对吧。安装的一些什么目录我们就不管了,就默认目录下吧,下一步。有没有新的采用我们的旧的文件,因为我们这是新的安装,所以没有。这里写的是我们的。监控服务器的主机地址别写错了,我的是幺幺对吧,那底下是给他加密,我们就不加密了,开启所有的监控类型。下一步那直接点击安装即可,那我已经在我的另一台机器上安装了这么一个组件,并且开启,开启的方式就是等你安装完成以后,底下会有一个start,你把这个勾一勾就开启了,还是比较简单的,对吧,都是鼠标点击的方式,相信大家都应该能完成。
15:07
那我的机器呢,是10.10.10.99。那我们就去构建一下。我们可以拼一下,尝试一下对吧,10.10.10.99。没问题对吧,好,那现在我去监控他CD到。Your logo下的logs下到我们的ETC下到我们的object下,这里是不是已经有一个Windows监控模板了,我就直接用它的了,对吧?好,打开我们的Windows模板。往下翻。第一个用到的模板是Windows server,这个window server已经在我们的模板配送件中出现过了,所以我就不需要更改了。主机名,这是定义的主机名,我们的我的是叫。呃,WIN7我是拿一台WIN7监控的啊利别名我们就不改了,那主机地址是幺零点幺零点幺零点。
16:01
九九别写错了对吧,对应的IP地址。往下翻,还是那句话对吧?组里必须存在,Windows监控里面Windows组必须存在,需要大家注意一下。好,再往后翻,监控我们的什么ns client加加的模板,但这里需要注意一下,House name我们已经改到了WIN7,对吧?别写错了,与上面的house STEM相互匹配里面上面定一个WIN7,下面搞个window server是吧?就不太合,就不太科学了,对吧?下一个定义的是我们的启动时间WIN7。好,以及我们当前的CPU负载还是WIN7。当然,我们也可以直接百分号S进行替换。我们直接把这个win server给替换成WIN7。好。那这样的话我们就已经都改好了,需要大家注意一下,这里有个模块。叫W3SVC,这个模块是在我们的I is里起到一个非常重要的这么一个子模块,所以它这里监控了I is is is。
17:10
也就是Windows了。呃,外部服务对吧?好,那它的切割NT呢,就是检测这么一个服务是否正常的,那WIN7是没有这个模块的,对吧?所以呢,这里会报错,那在这里的时候我就可以直接把这个模块给删除了,因为我们在这里不需要,当然这里还可以定义监控一些其他的属性,有兴趣的话可以参考一下我们的。纳的官方文件。因为这里面它的监控类型有上千万个。当然,我这句话一点没有夸张。已经发展,在原来来说,已经发展了将近十年的时间,上千万个监控对象,一点都不夸张。它的监控类型非常之多,非常之广,在当时它确实非常先进。但是耐不过时间是吧,好,那这样的话,我们就把一台主机给监控完成了,我们保存退出。
18:01
主机添加完成以后呢,我们还需要到我们的主配置文件中CAD上一步对吧,打开那CFG。在这里,我们需要把这台主机给添加进来。打开它的注释对吧?那这样的话也就意味着我们先定义了个Windows c fg,告诉他这台主机的地址以及监控的对象类型。然后在这边呢,再去把这个。CFG给链接到主配置文件中,让他去添加索引,好,那接着我们就可以检测一下我们当前的配置文件是否正常。没问题对吧,没问题的话,我们就可以去重启我们的那服务了。这里是需要重启的,需要大家注意一下。重启成功以后呢,我们再点到我们的耗那里就多了一台WIN7对吧,判定。干嘛就绪状态对吧,还在获取时间呢,需要大家注意一下,等会就有了,我们先不管。
19:05
那这样的话,其实我们一谈。Windows监控是不是就已经完成了,那同理,我们再去监控一台Linux对吧,我们去开启一台UR服务器。因为我这里呢,临时需要去连接到我的另一台服务器,所以我这里调整到了我们的桥接,你的可以不动,放到我们井主机即可。去领一下药。那接着呢,我们去监控一台Linux主机,Linux主机的监控稍微复杂一点,因为我们需要去安装一个NRPE,还记得吗?这是我们之前给大家提到过的,对吧?类unx操作系统使用的主流方案n rpe插件去完成。好,我们先把我们的n rpe。我们直接把我们的拉过的压缩包给传过去吧。
20:10
好,解压我们的拉斯软件包。传错了是吧?我们应该传的是ISO镜像。嗯。哪个是do?传过去。然后这边我们创建一个ISO目录,Mountt-o lo,我们把nas.iso挂载到ISO目录下,Copy-1ISO目录下的使用内容。拿到当天目录下。好,考核完成以后呢,接下来我们去安装在这台机器,我们去创建一个用户供与我们的那手续运行,就叫NAS。
21:06
好,然后呢,我们先解压我们的插件管理器。进入我们的插件管理器。目露西亚。点com con指定我们的运营的用户以及运行的组即可。这里需要大家注意一下,NRP插件之间是通过我们的open s s SL这个软件包去进行所谓的对对称的加密的。以及非对称加密的,那所以呢,在这里我们需要去安装一下我们的open s SL和open SL。我们提前去把它给装一下。这里稍微有点慢对吧,我们耐心等一下。
22:16
那完成以后呢,我们就直接MAKE2和。Make in install。然后我们已经装完了,对吧,那在这里我就提前去安装一下我们的open SL和open SL d。
23:20
好,那接下来呢,我们去解压我们的NRPE。我们采用的就是2.12版本,对吧,这里还有2.81,我们就直接用最新版吧。好,CD的rpe压缩包目录下。我们直接点个con菲格开启我们的加密,对吧?以及指定我们的lab库在哪里,在URL lab6的四维目录下,他自己就会去寻找。好,Make克奥去安装我们的一些NRP的DEMO以及客户端,对吧,上面已经告诉我们了,然后直接make in plug安装我们的。
24:05
安装我们的。Man stop plug。那接着呢,是这里相相当于是像我们那plug里去写入它的对应的调用方式,以及我们的。脚本。那接着再去安装我们的。守护进程对吧,也就是我们的启动命令。那接着再去安装我们的守护进程的配置模板好。都配置完成以后,我们要打开。U logo下的下的ETC下的Rp.CFG。这个在之前我们是没有见到过的,对吧,必须要安装完IP以后才能见得到,好打开它往下翻,我们会小到一个叫allow。这里耗的是不是只有本机啊,我们需要添加一个主机的机器10.10.10.1,也就是我们的监控服务器的地址对吧?逗号去隔开代表两个都启用。
25:04
好,那接着我们通过命令。下的并下的NRP-C指定配置文件杠D代表DEMO方式去运行,就是无进程的方式。那我们直接need state-apt,它启动的端口是TCP的5666号端口。这里已经代表监听状态了,对吧,没问题了,那接着我们就可以到服务器端去安装了。服务器端首先解压的是我们的n rpe。二点八一两边版本必须一致,你别这边用个2.81,那边用个2.16肯定是不行的,对吧?好,那接着我们到NRp2.8一下,我们去相同的配置对吧,编译安装。我这里已经安装完了open s SL了D了,对吧。这个步骤大家别忘了。好。Make。
26:00
然后make install。Pluging。安装完成以后呢,我们就可以定义对应的。调用方式了。首先我们到your local下的S下的ETC下的object的下。Copy-A。我们从Windows拷贝出来一个linux.cfg。用作我们监控幺二十台机器的这么一个模板信息,对吧,好。然后打开linux.cfg。模板,这里使用的是Linux server。机器是Linux。Alias是我的Linux服务。地址是幺二,别写错了对吧。那同理,这个主机组呢,我们就不需要了,之前我们也说过了,对吧,Linux里面因为我们就监控一台服务给大家演示了,对吧,我们就不需要主机主了,Linux里是可以不定义主的。
27:04
那底下的调用方式呢,也不对,我们全部删除。那。我们呢?Rpe呢,支持的用方式呢。这么几种方式。大家写一下。给粘过来。当然NRP的调用方式不仅仅只是这里面的几个,还是那句话对吧,这是这里只是给大家展示一下我们的书写方案以及书写的配置方案,仅此而已。这里我把它调整舒服一点。这一个写的是我们的P的什么,切个漏的对吧,我们的。负载检测。
28:01
这个是检测我们的用户数,以及我们的。什么总进程对吧。那这里需要大家注意一下,切on,切个come on呢,是不是使用的是我们的监控的脚本啊?监控脚本叫切割IP,还记得吗?如果你这里使用的切割脚本的话,你必须在哪个配置文件中得到体现?在这里会不会有一个叫做come?我们去搜一下有没有这个脚本。没有。没有代表什么含义啊,我们是不是要把这个脚本给定义一下。所以我们要在下面去找一行,把这个脚本给定一下它的用法。这里呢,这是一个固定用法,对吧,没什么好解释的。我们直接写进来即可。好。名称为切rpe,使用到的命令是在我们那个库下的有个叫切rpe,传递我们的主机地址,传递第一个未参即可,对吧?好,保证退出,那这样的话Linux监控就已经完成了,我们还需要到主配置文件中。
29:08
把这个给定义一下对吧,YYP。我们监控的是一台Linux。名片为Linux cfg保存退出。那接着我们去检测一下我们当前的。配置有没有错误对吧。杠V检测我们的配置文件有没有错误。这里报错了是吧?不能找到我们的这个狙击主服务在your local下object下的LINUX63行。
30:00
好,我们看一下有什么问题,好打开我们这台节点。啊。看懂了什么意思吗?主机我们定义的叫Linux,底下用的是买Linux对吧。好,买零米六四。保退书。我们再去检测一下没问题了,对吧,我们去重启服务service this stuff重启。那买Linux是不是也出来了,这台WIN7的是不是已经负载成功了,对吧,这里是不是都已经监测到了,这个Linux是不是要需要等一会对吧。等一会呢,如果出现正常以后,我会给大家去看一下结果。
31:43
经过一定时间等待以后,我们发现这里已经监控成功了,对吧,还是那句话。这里我们通过PE可以收集到的数据有很多,这里只是给大家简单写了几个去展示,对吧?有兴趣的话可以参考我们的官方文档。但基本上我估计这个操作你应该见不到了,原因是什么?还是那句话对吧,对于已经构建好了以后,知道它的大概的流程即可,对于你要新构建的话,基本上不会再选择拉作为监控服务了。
32:12
那这就是我们这章的内容对吧,我们从头到尾把拉好好的梳理了一下,有以及我们的对应的安装过程。这节课我们就先到这里,下节课再见。
我来说两句