00:00
好,那第一步咱们完成了,那我们看第二步,第二步呢就是去创建监控项啊,那现在呢,我们先以102这台主机为例啊,咱们在102这台节点上面先去创建我们所需要的一个监控项,这个监控箱在哪创建呀?是不是得先找到我们对应的主机对不对,找到配置,配置里边是不是有主机点点完之后呢?这儿是不是有102对吧?完了之后大家注意观察这儿啊,后边是不是就有这个所谓的监控项啊,对吧?啊监控项那大家注意观察啊,我们这儿这个监控项是不是啥都没有,但是人家自带的这个Z2的监控项是不是有113个呀,对吧?啊是这样的啊,然后咱现在来看一下,这儿是不是已经变绿了,哎,说是说明已经能够通信成功了啊好,那这个咱不用关注了,我们现在点一下咱们102那台主机的监控项,点点完之后呢?那同理,这儿也应该是一个列表,但是由于我们现在一个监控项都没有,所以是空的,对吧?那我们把这个过滤器给它收起来,然后呢,创建自己的监控项啊,那这个监控项怎么创建,我们来看一看啊,首先第一个第一个咱是不是需要先给这个监控项起一个名字啊,对吧?那在这儿呢,比如说我就叫做data node啊data node这个随便起个名字就行完,然后往下走啊,那大家注意观察,那这是不是有一个类型。
01:11
对不对,这个类型指的是什么啊?其实指的就是我们去呃发送这个数据的一个协议对不对?你看我这有啥,是不是有什么Z密斯客户端,那还有什么Z密客户端这个主动式对吧?刚咱们提到了,我们说皮斯发送出去是不是两种模式,哎,被动模式和主动模式对不对?那我们用的是什么模式啊,是被动模式,被动模式也就是第一个对不对?那当然你还可以选用其他的一些方式去来发送数据啊,那在这儿呢,我们用默认值就对了啊,然后往下走,下面这是不是有一个键值啊对吧?这个键值是什么?这个很关键啊,我们后边是不是有一个选择按钮,咱们点一下,点完之后你会发现这里边呢,会出来这么多的这个所谓的键值,这其实每一个键值都是一个什么呢?每一个兼职其实都是一个监控项啊,我们可以简单的看一看啊,呃,比如看第一个,第一个比较简单啊,这是啥agent.house nameme它会干什么,它是不是会返回我们这个客户端的主机名啊,对吧?啊,它返回的是一个字符串啊,那比如说这个a.P它返回的啥是不是,他会检查一下这个客户端是否可答,对不对,那如果可达返回的是什么?是一,如果不可达呢?返回的是nothing对不对啊,接着再往下还有一个什么什么A的点version,这个访问的啥呀?啊是什么?Z客户端的这个版本访问是一个字符串,那我们比如说再看这个,这什么是el.max这是啥意思?
02:32
哎,是我们这个agent所在节点的这个系统的允许打开的最大文件数啊,这个不知道大家清楚不清楚,就是我们正常一个Linux操的系统,它是不是会对同时打开的这个文件的个数做一个上限呀,对吧?那比如说我们这个I7默认是多少啊。默认应该是1024对吧?啊是这样的啊OK,那再往下走,那是不是还有一个参数,这是啥什么knno.max process这是啥呀?是操作系统啊允许啊同时运行的最大的进程个数也为我们进程个数是不是也是有上限的对吧?那同样它默认值也是多少啊啊,因为也是幺零十四啊是这样的,OK啊那这个东西呢,咱们呃,简单了解一下就行了啊也就是他能够去呃根据这些键值去获取相应的啊这个值,然后发送到我们这个四位啊那下边呢,还有很多很多,你比如说举个例子啊,这几个,这都是跟什么相关的。
03:24
是不是都是跟net相跟网络相关的呀,对吧,一些网络参数,那再往下走啊,再往下走,那这些,比如说我们找一个大家所熟悉的,你看这个这是跟什么相关的,是不是跟系统的CPU相关的,没错吧?啊那再往下呢,有没有跟内存相关的呀?啊那肯定也是有的啊,我们往下走,那下面呢,也会有与内存相关的啊在这咱们就不带一个找了啊肯定都有,你基本上你需要的系统参数它都能它都能它都它都有啊是这样的啊啊那关键是这些参数,这些这个所谓的键值咱们怎么选,怎么选择怎么使用。啊,然后大家注意观察一下啊,有些这个键值,它好像跟我们刚才看到的还不太一样,对不对,你像这些是不是直接拿过来就能用啊,对吧,但是有一些呢,你看它会有一个什么,会有一个什么方括号,方块里边含有啥是含有尖括号对不对,这些相当于是啥呀。
04:12
相对相当于是参数,哎,可能有些东西咱们用起来的话呢,还得给它传参啊,那我这个每个参数它代表的含义是什么,那我又应该给它传什么值,这里边是不是根本说的不是特别的清楚啊,对吧,那这个怎么办呀?诶,我们这个呢,你要想知道每个参数,每个键指怎么用,那你就得去官网上看了啊,那在这儿我已经提前把这个官网上相关的内容找到了啊,你可以搜索一个这个z agent镇的k z agent的K你就百度就行,那完之后呢,就能找到这个相应的文档,这里边呢,我们可以挑选我们呃所需的版本以及所需的语言啊完之后呢,诶,这就是我们所有的这个K值的解释说明啊,那你看第一个是不是就刚才咱们那个所谓什么A的house呀,对吧?诶这里边就有相应说明,然后再往下,比如说像这个。这个是不是就刚才我们提到那个带参数的呀,对吧?带参数的它这里边呢,会详细的说明每个参数,那应该代表的是什么内容,哎,你应该传什么值等等等,这里边会有详细的说明的啊,是这样的啊呃,在这儿呢,咱们由于时间原因就不再一个一个看了啊,这个咱们要看的话得看一天也看不完啊啊,那接下来呢,我们再回到Z比斯的工作界面啊,那现在我们得明确一下,咱现在的要监控的目标是啥呀?咱现在要关的是啥呀?我们要监控的是不是data node的进程对不对?那他怎么去监控data not的进程呢?
05:33
哎,有人说了,诶我我能不能监控一个端口号啊,可不可以啊,其实是可以的啊,其实是可以的,或者说我还可以怎么做呢?那在这儿呢,我们也可以再呃换一种方式,咱们换哪种方式呢?在这儿我们可以使用它去监测一下这个。咱来看啊,这个是什么。这个P点是进。
06:02
大家注意观察这个键值是不是需要我们传入一堆参数啊,对吧,那传这些参数是干什么用的呀。诶,它会根据你传入的这些参数去匹配相应的进程,然后返回的值是什么呢?哎,就是匹配到的这些进程的个数啊,那如果说我能够通过我传的这些参数精确的去匹配到data note进程,那咱们是不是就能根据根能够根据这个返回的进程数去判断这个date诺的进程是否存在了,对吧?啊,那如果它返回的是零,那就说明啥。说明这个进程没有了,挂掉了对不对?如果返回是一呢,那就说明这个进程还在,能理解吧,就这个意思啊,OK,在这呢,我们就可以使用这个process number这个函数来去实现我们的功能啊,在这呢,我们就演示一下啊,那这个函数是不是需要传这样的几个参数啊,对吧?那这里边每个参数分别代表的含义是啥呢?这个我们是不是得去官网上查一下对吧?来我们打开,然后CTRLF搜一下啊,找到PC.number然后大家注意观察啊,官网上这个函数的参数只有几个。
07:02
是不是只有四个,但是在他的这个,呃,Z工作界面上呢,有几个呀。有有五个对吧,它是不是最后一个这个zone是多出来的呀,对吧,实际上这个参数给大家解释一下啊,这个参数是在特定的平台上边才需要去传的,在我们这个森S平台上面是不需要传的,那所以在这咱们把这个参数去掉就可以了,以它官网为准啊好,那现在我们来看一下这几个参数分别是什么含义,首先我们看第一个name name是啥?是不是指的是进程名城啊,对吧?默认值是什么?是所有的进程,没错吧,然后接来往下走,第二一个user,这个user指的是啥?用户名,用户名指的是谁的用户名啊对,是不是启动这个进程的用户名啊,就这意思啊,接下一个state state指的是啥?是不是就是这个进程的状态啊,对吧?当然这个状态指的是linus系统进程的状态,这里面会有什么状态呀?啊,什么这个disc不间断休眠啊,什么run运行中sleep间断休眠,这个停止了,还有这个僵尸进程等等等等啊,其实在这儿呢,我们其实并不用去关注这个进程的状态啊,我们重点就关注啥就行了。
08:07
咱们就重重点关注这个技能的,在不在不就可以了呀,对吧,是这样的啊OK,那也就是在这儿呢,我们可以选用谁呀,是不是所有状态就可以是这样的啊,完了之后再往下最后一个这个是啥呀。可拉是不是有一个什么命令行,对不对,是不是这个意思吧?啊,那这个命令行这个指的是啥啊,给大家解释一下,实际上啊,这个可曼的烂呢,指的是啊,我们启动这个进程的命令。可蒙纳指的是启动进程的命令啊,这个大家理解一下啊,完了之后我们这个参数要填的是啥呀。是不是一个正则表达式是这个道理吧,那这个渴望呢,它到底是怎样的一个使用逻辑呢?其实是这样的,在这儿我们需要去写一个正则表达式,然后呢,它会根据这个正则表达式去匹配这个进程的启动命令啊,如果能匹配上,那是不是相当于就拿到这个进程来,对吧,匹配不上,那这个进程就会被过滤掉,是这样的啊,那所以说在这儿我们这几个参数到底应该怎么传呢?
09:06
到底是怎么传呀?啊,其实传的时候我们重点传谁就行,重点就传这个command烂就行了,也是我们重点是不是就写一个正则表达式,然后呢,我们如果说能够通过这个正则表达式去匹配到data node进程的启动命令,那我们是不是就能够精准的拿到这个呃,进程的个数啊,对吧?啊,如果能匹配到,那我就让他返回一,匹配不到呢,就返回零,那我们是不是就可以根据这个一和零去做相应的判断了呀?啊就这样了,OK,好,那现在我问一下大家啊,那大家知不知道这个data node进程的启动命令到底是啥呀?Data node进程的启动命令到底是啥?这个大家知不知道?知道不知道。Data note的启动命令,我们之前怎么起的,之前咱好像是不是就执行了一个什么start d FS这样一个命令,对不对,那这个是data not进程的这个所谓的command吗?是吗?不是啊,这只是一个啥,这只是一个shell脚本,对不对,那你说这个shell脚本里边他做的工作是啥呀。
10:04
其实这个烧小脚本里面做的工作就是获取,我们这大家都知道datano进程是一个Java进程,对吧?啊,它是获取Java进程的所有的这个依赖啊,就是获取那个class pass,然后进行相应的拼接,拼接完之后呢去干啥?是不是去形成最终的这个启动命令啊,对不对,是这样的啊,这个不是data node进程的启动命令,那data note进程启动命令到底怎么看?我们可以这去看一下,我们可以执行一个杠EF,然后面呢,我们来一个比如说gra一下GP是谁,就gra note,然后回车,大家注意观察一下啊,那此处是不是咱们把data进程过滤出来了,对吧?那我们data note所谓的command启动令就是谁呀?实际上就是这一大堆。这就是datanode进程的启动命令啊,那大家可以看一下这是一个什么命令,是不是一个加va命令对吧?那加入进程肯定得用加入去启动啊,啊就这个意思啊,那也就是说我们是不是就要做的就是啥,是不是写一个正则表达式,然后呢,让这个正则表达式去精确的去匹配到这样的一个,诶可蒙德烂是不是就可以了呀,对吧,那你说咱这个正则表达式得怎么写呀?
11:09
怎么写能匹配上?那其实最简单的一个方式,我我就写一个datanode,它能不能匹配上,能匹配上对吧,你就写一个data note就行啊,是这样的啊,那当然呢,呃,我们再去写这个的时候呢,也不能一直都像这么随性啊,你不能随便写啊,为啥你要是随便写的话,你比如说我这写一个加号,你写个加号行不行,那肯定不行,你写一个加号是不是会匹配到所有的加号进程啊,对吧,你必须得找到一个什么呀啊,就是这个可曼拉的它它自己一个唯一的一个特征,对吧?啊,这样才能精确的匹配啊,那当然在这儿呢,我们现在使用datanode就可以,这个相当于比较简单啊,那所以最终我们这个参数到底应该怎么传,我们看文档在这儿呢,我已经给大家准备好了啊,来我这个每一步都有相应的截图,在咱们来看一下,那在这儿呢,我们是这样去传的啊,前两个参数我们是没传对吧,你看是不是有两个这个逗号对吧?说明第一个参数,第二个参数我们是没传的,没传表示用的是啥呀。
12:02
默认值啊,默认值啊是这样的,那第三个示函数是啊,是奥奥代表的是不是所有啊,对吧?那最后一个点note就是我们传的那个,诶所谓的正则表达式啊,现在我们按照这个呃去填一下啊来我们找到这个配置界面啊,那在这里边呢,我们把name给它去掉,这个进程名称咱不用管这个user nameme呢咱也不用管,那这个state呢,我们用谁用那个所谓的or是不是就可以,对不对,最后一个command line我们换成谁,换成data nod,那这样一来它就会使用datanode去匹配相应的进程啊好,那这个没有问题的话呢,我们继续往下走,往下走大家注意观察这个位置,这一个啥是不是有一个更新间隔,也就是我多长时间给这个四二发送一次数据,对吧?就这个意思啊,那咱这呃,为了这个效果更明显一点啊,我给它换成五秒钟一次啊,那咱们主要是为了更更快的看到效果嘛,啊啊那完之后呢,我们其他就不需要再做相应的配置了,我们点击添加就可以了。啊,那这样一来,大家这注意观察,这儿是不是就多了一个这个所谓的监控项啊,对吧?那你说是不是有了监控项,我们理论上这个agent就应该给这个server发送数据啊,对吧?啊,那你说我现在能不能看到这个数据呢?应该是能看到的,在哪看啊,我们点一下侧边栏,侧边栏这是不是有一个监测对吧?监测里边是不是有一个最新数据,对,咱们点一下最新数据,最新数据里边呢,下边这儿是不是会有一个列表啊对吧?那大家注意观察,我们看这这个102主机是不是有我们刚刚自己添加的主机,那这个data note是是就我们自己添加的监控项,那后边最新数据是不是就是一呀,对吧?那说明我们现在这个数据是不是已经过来了呀,对吧,就这个意思啊好,那过来之后,那理论上我们那个HIDO102主机,那后边那个,可那个可用性是不是应该会变绿。
13:46
对吧,现在是不是就OK了啊,是这样的啊,这就是我们添加监控项的这个步骤啊,OK,那这步完成之后,我们再往下去干啥了呀,这步完成之后,下一步是应该去配置那个所谓的触发器了,对吧?啊,OK,那这个触发器我们下节课再配吧,来,我把视频停一下啊。
我来说两句