00:00
欢迎大家继续收看上硅谷的Linux云创视频。大家好,我是汪洋老师。这节课呢,我们去学习监控里面的第一个监控服务,也就是我们的开。那首先呢,在这章的讲解里,我会分为三个片段。第一个,带大家去了解一下我们开体背后的原理,以及它的各个组件之间的功能。那第二个呢,我们会把T体给构建一下。去看一下它的一些相关配置。第三个章节呢,片段呢,我们会去学习一下开启的插件的添加。什么是开的插件呢?可以这样理解,开机本身的功能不是那么的多。如果你需要其他的一些补充功能的话,那你就需要去添加不同的插件。那我会带大家安装一个比较能够看到结果的这么一个插件,那其他的插件的方式呢,都是一致的,那相信大家应该都能够。
01:00
呃,举一反三了。那首先我们先看第一个章节,就是什么开体的原理概述。开启的原理概述里面呢,我们先看一下它比较重要的一些组件。这里有这么几个组件,第一个是我们的r d two。R d two这个软件如果在之前的课程中,如果呃,大家听的比较详细的话,其实我们在。监控概述里就已经引入过这个知识点了,就是阿里兔,它是一个绘图软件,是用C语言去编写的。效率非常之高,性能非常强悍。但唯一的缺点,缺点就是由于它的过于灵活。所以造成这款软件使用起来比较费事。我可能画一张图对吧,可能有两行两个命令行,这么这么宽的一张图,我可能输入代码不止两个命令行。比较费事。那所以这个开发者呢,为了这款软件能够便于被大家调用,它起了一个很好的带头作用,加入了开团队。
02:07
把开里面的绘图工具或者绘图功能。直接引入到了r two,交给他去完成。也是因为RD two加入了。开呢?它的图形化展示功能名声大噪。相辅相成的这么一款软件吧。也就意味着在CA里面所有的图表的绘制都是由rt two这块呢,你去完成的,需要大家注意一下。非常重要的一个组件,对吧,好,下一个叫SMP。叫network management对吧,也就是我们的简单网络管理协议。他是我们发展至今为止,对于监控来说是最重要的一个协议,没有之一。你可以理解为,现在只要是做监控的,没有说不支持SMP的。那当然,对于我们的服务器也好,对于我们的网络设备也好,可能是你家的交换机,它都是支持SMP的。
03:06
这是完全没有问题的,只要符合工业工业标准。这就是我们两个在我们的开里非常重要的组件。那当然还有一个,我们在这里没有画出来,原因是什么呢?相信这个东西大家应该都不陌生了,对吧。阿帕奇。阿帕奇。那这款软件我就不给大家详细的去赘述了,对吧,相信大家都比较熟知了,那这个呢,就是我们在开里面非常重要的这么几个部件。他们组合而成了整个开体的平台,也就意味着其实开体你可以理解为它就是一个平台展示工具。收集数据由SMP完成。绘制图表由RD two完成。展现。由阿帕奇把这个页面给分发出来,或叫分发对吧。这就是几个对应的功能,那开呢,相当于把它们给融合在一起。
04:02
需要大家注意一下,就这么一个监控平台。那大家也看出来一个问题对吧,就是SMP这个东西。非常重要。非常重要对吧,监控服务5万服务就两种,第一个就是收集数据,收集完数据以后就展示给用户去看。那如果数据都收集不到的话,那。核桃来展现给用户了。那接下来呢,我们就去简单的去学习一下我们的SP的它的一些概述,以及它的用法。首先讲SMP的话,就必须要讲一个东西。他叫我ID。OID。那叫身份认证标识。身份认证标识。I。那身份证的标识是干嘛的呢?就是举个例子。我问一个人说我,我走路上看到我一个朋友可能叫小汪对吧,我说小汪。
05:00
今天过得怎么样?结果一般人来回答的话,是不是就是,嗯,还行。不太好对吧,那结果他呢话唠。哎,我今天早上吃了一个什么饭,我下午吃了一个什么饭,晚上吃了一个什么饭,然后呢,我又遇到了什么什么人,又发生了什么什么事,讲了一堆。其实我只是见面想打一个招呼,仅此而已,对吧?结果他哇哇哇半个小时过去了,还没讲完。如果是你的话,你会怎么办?可能很尴尬的一笑,啊,还不错是吧,就把他给打过去。那对于服务器来说,如果传输的数据量本来只是问你要一个,哎,兄弟,你主机名多少?结果他发了一大串我们当地的CP利用率啊,内存利用率啊,一些乱七八糟的东西,其实你是不需要的,对吧。那对于服务器来说,这是不是相当于就是一次浪费,资源的浪费?带宽受影响,CPU受影响,我收集到数据过多,我需要去过滤啊。
06:00
这个都很好理解对吧。那SNP呢?发展至今为止,它涉及到数据种类非常之多。SP的没问题,TCP的没问题,Udp的没问题,服务器性能没问题,内存没问题,磁盘没问题,只要你能想到的大,只要是我们的比较标准化的这么一些数据收集方案都支持。非常之广。信的。所以就会带来一个问题。什么问题啊,资源占用过多。那这样的话,我怎么去便于它的调用呢?我们可以想到之前我们在阿帕奇里学的阿帕奇是不是有个叫做动态共享对象啊?当阿帕奇需要一些模块的时候,我们可以通过我们的配置文件的修改把这个模块给加入进来,那这样的话阿帕奇的模块又多了,又不会由于模块的过多影响阿帕奇的性能。SNPH一样。虽然我支持收据的数据方案有很多,或收集的数据类型有很多。
07:02
但是我没必要把所有的收集到数据类型都给你。而你告诉我OI号,我去拿对应的OID号,对应的数据的数据的信息返回给你客户端。那这样的话是不是就可以了。也就意味着OID相当于就是我们服务器端和客户端之间的一个暗语,告诉SP你要收集的是什么数据。对吧,这样很好理解了,对吧,那接下来呢,我们可以看另一张图。这张图里写了这么这么一些东西,对吧,我们看到是一个层次关系的。那也就意味着这里依然是一个根根,我们一般都用点去代替,对吧,好。那看底下最下面这一列什么系统的网卡的对吧,我。我们的计划任务的,我们的I pd相关的SP的,Tcpudp的等等,对吧。那这些东西我们可能都不太陌生对吧。那所以呢。
08:01
这就是我们能够收集到的数据的种类信息。看到还是非常全的,对吧。那怎么去告诉他,比如我要现在想去收集一个TCP的。信息你当前的TCP连接状态。那我应该怎么办?我们可以看到这是一个竖叉的分支,对吧。其实它还有很多的不同的子数差,我们这里只是举了一个比较在Linux服务器里比较常用的一个树杈分支而已。那怎么去定位呢?Root用点去表示对吧,那底下是不是写了一个一啊睡觉。点一,那底下是三分之下的,所以点三,六分之下的点六,一分之下的点一,二分之下的点二。Map一下的点一点,比如是TCP6。那如果我告诉我们的SP说,你去帮我要个点1.3.6.1.2.1.6的这么一个数据信息。
09:01
那SP呢,就秒懂了,诶你要的是TCP连接对吧?好,我去给你找。就这么一个流程。这样还是比较通俗理解的,对吧。那接下来呢,我们去给大家演示一下,这个开体到底能不能去通过我们的SMP收集到数据,或者是SMP到底是怎样收集数据的,我们可以给大家简单的去构建一下。首先。我们先开两台服务器。
10:31
那假设我现在这台是SMP的服务器端,需要注意一下。想收集到数据的一端,安装的是我们的SMP的。服务器端,比如我现在想要一下幺幺的CPU信息,那他应该安装的是服务器端。客户端是想去收集,比如幺二想去收集幺二的CPU,那应该他服务器端,它是客户端,这里的服务器端和客户端的概念需要大家去掌握一下,对吧,别搞混了,那首先我们需要在这里面去安装我们的。
11:03
服务器端的软件。亚么杠,One in store。Net s以及net s us。安装完成以后呢,我们就可以去改开启了。SM pd start。启动。启动成功以后呢,我们可以通过一个命令去索引,安装完uiles软件包以后,我们就会得到一个客户端工具,它叫snmp walk。杠V可以指定它的版本信息,那比较常见的版本有这么几个版本,需要大家注意一下。我给大家写一下。第一个版本呢,是V版。
12:03
第一个版本是我们的V1版。V1版呢,它非常简单高效。他把我们之前想要收集到数据的种类已经做的非常之完善了。那但是有一个比较小的缺点,就是不支持加密。以及身份认证。那在VR版的时候,他把我们的身份认证给做了。在V3版的时候,他把加密给做了。那你会发现这几个大版本的更替,他才去把我们的身份认证和我们的加密完成。其实也可以比较容易去理解,那也就代表这个软这个功能可能重要性不是那么高,原因是什么?问大家一个问题。现在我的监控服务器。构建在我们那。
13:01
内网环境中对吧。那一般人访问我们的监控服务器,比如这就是我们监控平台。叫NM。S。监控管理平台。那如果是我们的内网访问过来的话,那你觉得这个监控服务器还需要做加密吗?如果我都能直接内网访问到你的监控服务器了,我想干坏事还不是很容易吗?能听懂我意思吗?所以V2V3这两个根本不是我们的痛点。所以你会发现啊,经过了很久两个大版本,才把这个所谓的小问题给解决掉。那常见的版本就这么三个版本,大发行版本。那RC呢,我们现在要用的这个RC呢,就是它其中的一个子发行版本。这是我们的这代支持的这么一个版本,信息好,然后杠C-C指定的叫共同体名称。这是我们的SMP的一个专有名词,那如果你把它翻译成比较通俗的话去说的话,就是主号。
14:06
大家都要在同一个组里,你才能对我收集数据比较好理解,对吧?那对于SP来说,它的默认主号就叫public。默认主号public,好,后面跟上我们要收集的服务器的IP信息,以及你要收集的我们的对应的服务名,比如我们收集一个TCP的。那这里会告诉我没有对应的对象去对应这个OID对吧,那我们换一个,比如我们收集C题。STEM,我们在我们刚才的这个列表里也看到到对吧,它是点幺的列表。那为什么我们收集能收集到呢?对吧,收集我们的STEM状态信息,我们可以看一下在哪里,在这里对吧。操作系统,你的主机名叫什么,你的那个版本,你当年的时钟的设置,这里都会有,对吧?好,那就意味着肯定是我们的SP没问题,而是出在了其他的问题上。
15:05
那怎么去理解这句话呢?我们可以直接打开我们的SMP去看一下。我们往下翻。给大家简单介绍一下,这里呢,定义的就是我们的。什么共同体名称定义的就是public,这里是默认值对吧?好,底下支持的我们的版本V1和VRC2个版本,我们再往下看V5。名称,诶就定义了一个视图,视图名称为CV,然后加载了一个OID,这OID对应的是什么?点1.3.6.1.2.1.1,那我们对应到这张表里,我看一下点一。点3.6.1.2.1.1。没问题吧,是不是就是这个OID啊,也就意味着他在这里把这个ID给标识了,所以我可以通过C题D的信息,他把我收集到。
16:00
原因就在这里。那因为。大家可以看到对吧,我们这里的我们的CD的信息,它是不是已经标识在这里了,所以它能收集到。那如果我想去收集一些别的数据信息,我是不是还得写个点三的,点4.5的,点六的,点七的等等呢?其实我们可以不必要这么麻烦,我们往下翻。往下翻。这里是不是定义了一个叫V2。这个奥不代表所有的意思,这个奥代表的是视图名称,但是它确实是把点一下的,后面什么都没有写,什么含义啊,只要是我们的ISO国际标准化组织体系下的,他都支持。都支持收集,所以我们把这个选项给打开以后,我们再往上翻一个叫access。防控制对吧,这里是不是有个叫read notify,也就是读写。和我们的通知。那这里我们可以把读给它改成二,也就是我们刚才开启的这么一个所有的监控选项。
17:05
保存退出。因为修改了SP的我们的配置文件,所以我们需要去重启SMPD。重启成功以后,我们再去收集一下我们的TCP的信息,我们看一下。已经收集到了,对吧,比如收集收集我们的udp的都是没问题的,那TCP下我们可以看到,诶这里是不是有个叫10.10.10.1的22端口I IPv4连接,连接到了10101024050960的随机端口上,并且有数据传输中。这里是什么东西,是不是就是我当前的叉CL连接啊,我本机是不是就是240。这是完全没有任何问题的,对吧。那这个呢,就是我们的SNP的收集数据的方式,以及简单的配置方式。那接下来我们再回顾我们的,回到我们的开工作架构上,我们继续往后看。
18:02
开立工作架构呢?分为两种模式,第一种是我们的CS结构,第二种是我们的BS结构。CS结构负责我们的数据采集,它是由我们的SNMP协议完成。BS结构负责我们的展示。它是有我们的RD two。绘制成图片以后,再由阿帕奇把数据给展示出去。需要大家注意一下。那底下呢,就是这么一个流程对吧,那阿帕奇想要去复构构建比较复杂的一些网站的话,需要借助PP语言对吧?那PP语言会插入我们的读取我们的数据库,读取相关配置以及一些模板信息。然后呢,R d two呢,会负责将我们SMP收集到的数据把它绘制成图片,然后呢,图片会被我们的阿帕奇分享给用户去看,对吧,那这个呢,就是我们的CAD的整个的工作结构。那这节课呢,咱们就先讲到这里,下节课再见。
我来说两句