00:01
前面呢,咱们已经把我们ZS对哈杜102这台主机的监控,然后呢,报警啊,整个流程呢给大家演示了一下,那么在基成gra呢,以及瑞象云进来之前呢,咱们首先呢,得先去考虑一个问题什么呢?说我现在一共有三台主机,分别是102 103和104,那目前咱们只是对102来做监控了,那103和104呢,还没有做监控,那我如果想把103和104也监控进来,那怎么办呢?那第一种比较笨的办办法是吧,也就是咱们想的这种是吧,那就是把我们现在呢,对102它所做的操作呢再走一遍呗。是吧,那么就是在咱们这里啊,那我不是一个个配置了什么监控项,配置什么触发器吗?配置什么动作吗?那么咱们现在在103104上,我重复的再做一遍。如果说你的主机比较少的话,这还可以,但如果说你当前主机比较多,每一台主机呢,你都要把咱们当前这些东西配置一遍,这是不是就比较麻烦了呀,所以说这个时候呢,同学们可以考虑什么呢?可以考虑使用模板啊,使用模板这个模板呢,就是相当于把你的什么监控项的配置呀,触发器的配置呀,对吧,包括一些动作的配置呀,对吧,放在一起组合在一块儿,对吧?然后呢,咱们形成一个模板,那么这个模板呢,它可以配置到不同的主机上去,对吧?那么咱们可以看到,那其实我们现在啊,这个ZS已经帮咱们集成了啊,默认的很多模板进来啊,监控一些什么内容都已经有了,对吧?那么咱们自己呢,创建一个模板对吧?来同学们,咱们在这里在右上角这里有一个创建模板的操作点一下。
01:41
那么点击到创建模板之后呢,那接下来你可以给你当前创建的模板呢,取个名称,比如说我这个就叫hard豆a time,然后呢,咱们把这个模板放到哪个组里边进行管理,这个其实就方便进行管理的,咱们前面是不是在创建主机的时候,我们已经创建一个hard豆这个组了呀,对吧,那我也把它放在这个组里面进行管理,然后接下来咱们把这模板呢去添加一下。
02:06
那么你现在呢,这个模板创建出来之后,那么这个模板呢,它也是对吧,没有什么监控信息,也没有什么触发信息的,所以说呢,咱们可以对我当前这个模板呢,来进行配置,把它点进来啊,把它点进来,那么点进来之后呢,咱们可以去配置这个模板的监控项啊,我当前啊,到底在这个模板里边都监控些什么内容呢?那么这里没有,那没有的话怎么办?没有的话呢,就像刚才咱们对主机配置监控些像一样,咱们呢去创建监控项,把这个东西创建一下。那么咱们这里呢,在创建监控项的时候注意啊,同学们,咱们需要给它指定你创建监控项的名字是什么?那比如说我现在监控的是对着notde随便给他取名说老师你这个名字和刚才主机它的名字重复了吗?没关系,同学们,那个是主机的是吧?这个下边的这个是模板下边的,它的上面还有一级区分的啊,然后接下来那么你要监控什么呢?那比如说我现在也要监控啊,咱们当前这个主机上data node它的一个进程数量。
03:09
那么如果监控进程数量的话,那么这里咱们选择类型是扎币的客户端,然后具体的指标呢,咱们其实是一个进程数对吧?那么这里我选择咱们进程数对吧?那么在进程数里边对吧?那么是所有的进程,然后所有的用户,然后呢,所有的状态啊,所有的状态以及呢,咱们在这里可以过滤一下,我当前呢,把这个对的noe给找出来啊,那么这个间隔时间呢,咱们一分钟太长了,我就让它间隔五秒钟就可以,那么咱们这里去添加一下,那我现在这个兼控像有了,那么兼控项有了之后,也就是说我知道啊,我现在要监控什么东西了,那么如果说我现在诶这个指标发生变化的话,那么咱们是不是要触发什么操作呀,那么这个触发条件是什么?那我需要去配置一下触发器,把这个触发器呢点过来。
04:02
那么点的触发器里边呢,我们可以发现这里边其实呢,也是没有触发器的,我们呢,现在去创建一个触发器出来啊,在这里右上角这里创建一个我们触发器,那么在创建触发器的时候,同学们这个操作咱们前面也做过对吧?算是熟悉一下呗,对吧,算是再去巩固一下,那我现在创建一个触发器对吧?它的一个名称,比如说这个呢,是我们这个data node trigger啊,然后接下来它的一个严重性啊,那我会归为严重,然后呢,那满足什么样的条件去触发对吧?咱们把这触发条件呢给添加一个,那么咱们现在对吧,在每台机器上我呢有一个date note,它这个监控项也有监控的是date note进程的数量,那么如果说我拿到的这个date note进程数量要是小于一的话啊,要是小一说明呢,咱们data node给挂掉了,那么挂掉的话,它会触发我们现在的这个触发器啊,这个这个触发器呢,会被触发。
05:00
那么出发之后你要去执行什么样的操作,该配什么了,同学们是不是得配动作了呀,所以说接下来同学们咱们呢来配置动作,那我们现在这个动作是什么,是不是去发送邮件呀,对吧?那么这个发送邮件动作呢,那我已经配过了,但是同学们,那你看到咱们现在呢,在这里我们呢这个发邮件这个动作对吧?那么他是什么时候被触发的呢?它是在我们现在呢这个触发器对吧?哎,那么他的这个韩豆102这个主机上,它的触发器被触发的时候,它才会去发送邮件,那么除了我现在呢,对主机的这个触发器触发,那么我现在是把有个模板触发器啊,所以说在这里我添加一个添加什么呢?对吧?在这里触发器等于谁呢?选择注意啊,这个东西它不是主机的了,是咱们的模板的对吧,那我现在呢,把这些东西也添进来,添进来之后咱们要去启用一下啊,添进来之后咱刚才看状态不是给关掉了吗?把这里我启用一下对吧,那么也就。
06:00
说咱们现在呢,这个触发条件呢,有两个,什么时候发送邮件呢,第一个,那如果说102这个主机上它的一个触发器是被触发了。啊,那么咱们会发送邮电,那么第二个如果这个模板它的触发器被触发了,找这个触发器触发条件是什么,是不是都是对not它的一个技能数小于一了呀,对吧?那么咱们呢,都会去触发发送邮件这个操作啊,那么这个发送邮件操作是怎么发的呢?给谁发是给我们这个adinrator这个下边这个组下面的din的用户来发送的,对吧?咱们把它呢去更新一下,那么更新完毕之后呢,同学们,那我这个模板呢,其实就创建完了。对吧,那么我接下来做的事儿是怎么样去把模板呢,应用到我们的主机上,你看咱们现在我自己创建的有三个主机,102 103 104,那么目前呢,咱们现在这个102它已经有监控项,咱们自己手动配的,但是103和104呢,还没有,那怎么办呢?咱们可以给我们啊这个103104,把刚才我们创建的模板链接上,怎么链接点进来,点103啊,点103。
07:10
那么点163之后呢,那么这里对吧?那你看有一个选项叫模板啊叫模板,然后咱们现在呢,在这里可以把刚才我们创建模板呢给链接过来,然后更新一下,那么104呢,也执行同样的操作,对吧?去选择咱们刚才呢把这个模板,然后呢,在这里去把刚才咱们创建模板给应用到我们这个104上,也更新一下,对吧?那么这个更新完毕之后,同学们,那接下来你看我们三台主机,102 103 104是不是都有监控项以及我的触发器啊,对吧?那么我现在要做一个测试了,对吧?怎么做测试呢?同学们,那大家可以看到啊,那我现在来到我的102上,然后呢,去查看我们现在进程情况,那目前这三个节点上都没有我们这个地震弄的,也就说我现在adms进程没有启对吧,那我现在呢,去把我们这个adms进程给启动一下啊,把我当前HDMS进程启动一下,那么启动完毕之后呢,大家来到我们现在这个邮箱中对吧?注意看同学们,那么这里呢。
08:11
你先把这些优先呢,对这个你先不用管它对吧,这地方你先不用你管它,对因为咱们现在这个发生变化了嘛,对吧,那么咱们现在呢,这不用管它对吧,你看啊同学们这个什么这个呢,其实是我们对吧它的一个邮件对吧,因为刚才咱们现在呢,是把这个对吧,这个进程发生变化了嘛,对吧,那么接下来那么我现在呢,要把它停掉,注意看啊同学们在这里我们呢主要去看一下停,那么我现在每一个节点都有did notde,然后呢,我现在邮箱中吧,我现在呢,这个邮箱里边,我现在邮箱里边那么是没有新邮件的,是没有新邮件的,然后接下来那么咱们呢,要去把我当前呢,对吧,它的一个对着弄的给他挂掉对吧,那也就是说我要执行stop d FS把这个呢,我去给他停一下。
09:00
那么当你执行完咱们停止操作之后呢,大家看,那么你来到我们现在呢这个邮箱中,对吧?你先来到邮箱中,那么在那邮箱里边呢,这应该有三封邮件啊,这里边呢,应该有三封邮件,那么这三封邮件呢,同学们,那你可以看一下咱们当前这三封邮件呢,那么这里应该来自于三个不同的主机,一个呢是我们现在对吧,这个103,一个呢是我们现在104,还有一个呢,是我们现在102对吧?诶那么咱们现在那你发现那如果说的进程发生变化的话,对吧,原来是一个现在挂掉了对吧?那么这个时候呢,他可以收到我们这个邮件,好了,同学们,那这样的话,关于我们现在这个模板的介绍,对吧?关于呢我们现在整个对吧,这个使用zics,然后呢,它本身去完成对目标主机的一些监控项的监控,对告警功能,那咱们就对进入完了,那么再往下的话,我就要集集成格然塔对项也进来了啊把这个停一下。
我来说两句