00:01
好,那当我们瑞向云呢,它的一个通知策略配置完毕之后,然后分配策略也配置完了,那接下来呢,咱们就开始准备去做一个我们测试啊做一测试,呃,那么如果测试的话呢,还是从我们这个Z贝来开始,对吧?那么大家可以看这张图,那么整个呢,咱们现在这个流程呢,应该是这样的,我们现在呢,那比如说我应用程序运行在我们啊这个运行环境上边,然后呢,我们现在呢,比如说我在我应用中我用到了HDFS,那么HDFS呢,有三个节点,分别是102 103和104,咱们现在呢,对102 103 104这三个节点对node呢来做监控,那么这个监控是由谁来完成的呢?那是咱们的杂贝本身来完成的,对吧?那么扎贝做完监控之后呢,那么咱们要想把一些指标,它的一些监控效果给展示出来,那我们说扎贝本身呢,其实也提供了我们现在图形化的界面展示,但是呢,相比较gra的。
01:02
Grana来讲,那它呢要稍微弱一些,所以说咱们这个展示呢,我们用的是grana,对吧?你可以看到我们目前102103104上它的一个data node,那目前呢是启动着的啊,然后接下来那么咱们呢,这个除了展示之外,那我还要去做报警,比如说我现在想去监控这三台主机,一旦data node进程啊,要是挂掉的话,那么这个时候呢,我要发送报警信息,那么杂贝子本身呢,其实是可以去做咱们报警的,对吧?你像咱们前面的案例,我发送邮件就是通过Z贝S来发送的,对吧?但是呢,相比较专业的第三方报警平台来讲,那么它的一个告警媒介呢,就要单一一点了,对吧?你像咱们的瑞向云,除了我们的邮件之外,那还有其他的一些比较丰富的告警媒介,对吧,所以说咱们这里呢,这报警我想用瑞向云来做,那么如果你要想用瑞向云来实现咱报警的话,同学们所说呢,那我需要来到我们Z位这里,那么来。
02:02
它在这里呢,同学们,我们把原来我配置的东西呢,我们大概捋一遍,首先呢,那我们在这里我先配置了主机,这个主机呢,是我们现在要监控的三台对着noe节点,那么在这三台主这个节点上面,我们主要监控什么呢?我们配置监控项对吧?那么每一个监控项我们在这里我配置了对吧?那比如说我要监控的是我们现在呢,它的一个date node,它的一个进程数对吧?你看在咱们这里边,我监控项配置的是我们监控的date notde,它的一个进程数对吧?然后接下来那么你监控它,那么那我现在如果说,呃,那这个当前这个date notde,那这个进程如果说要是满足一定条件之后,我要报警啊,那么这个条件是什么呢?对吧?触发报警的一个条件是什么,对吧?那么这块呢,我们配的是触发器对吧?那么这个触发器咱们怎么配的呢?咱们说如果说date node技能数如果要是小于一的话。对吧,在咱们这里边我们配置了,如果当前呢,这个date node,它的一个进程数量如果小于一对吧?那么这个时候呢,我要去触发相关的动作对吧?所以说接下来那么咱们把触发器配完之后呢,咱们去配置了我们的动作对吧?那么咱们这个动作呢,我是对原来我配置发邮件啊吧,在这里有一个stand email,那么这个呢,是我自己对吧?这个创建的动作啊,那我们现在大家想一想,我现在呢,这个发送邮件这个操作是不是不应该是由Z来做了呀,所以说呢,那么我们要把这个动作呢给停掉了啊,就原来啊我们自己创建的这个send email,这个发送邮件动作我们要把它停掉了,对吧?那么当你现在在Z安装我们瑞向云插件之后,那么这里呢,它会帮你自动的创建一个新的动作,对吧,那么这个新的动作干啥呢?这个新的动作就是他把扎被子采集到的一些指标的对吧,这个变化对吧?那么这个发送这个告警信息,这个操作他要交给谁呢?他要交。
03:59
不给瑞向云来做,就这个东西不是我们撒贝来做了,是瑞向云来做了,对吧,但是我现在动作什么时候被触发呢?同学们你是不是得把这个动作和触发器给它绑定在一起啊,再加上这个触发条件啊,所以说呢,那么咱们首先先把我原来呢这个3.ma这个动作给停用,然后接下来那我要把使用瑞向云发送我们告警信息,对吧?那么这个动作呢,和我们触发条件来绑定起来,那就来吧,同学们来到这里啊,来到这里我们现在对他做我们的修改对吧,做做做修改,那么这个做修改呢,那你可以看到咱们当前呢,在这里我这个条件啊,我当前呢这个条件对吧,那么这个条件这里边呢,咱们应该去添加一下,那第一个同学们,那如果说要是我们这个102的话,咱们呢,其实是没有使用模板的,对吧,那么我这里单独的就是触发器,等于,然后咱们选择一下对吧,那么这个时候咱们应该不是模板对吧?那不是模板的话,咱们其实呢,就是。
04:59
102 102这边呢,有个单独的date notde trigger把它选择一下对吧?诶,这是第一个,当102的触发器被触发之后,也就是说102的对的node挂掉之后,咱们会触发这个告警信息,那么除了这个102之外呢,咱们把103和104它的配置时候,是不是使用模板统一配置的呀,对吧?所以说呢,咱们这里,那我应该再去选择一个,这个时候选择就不是我们102了,那应该是选择我们这个模板啊,那么咱们现在103和104使用的是我们当前这个模板对吧?那么这个模板对应的触发器呢?诶,那咱们把它放过来对吧,也就是说如果103和104它的data note也挂掉的话,对吧?那么这个时候我要去触发我们现在的这个动作,那么这个动作它主要做的事就是把这个消息发送给谁呢?发送给我们现在它的一个瑞象云,对由瑞象云呢,来帮你去做告警好了,同学们,那么这块的操作呢,不需要改,直接呢去点一下更新就OK了。
05:56
对吧?哎,那么咱们现在呢,把这个东西做好之后,同学们,那接下来呢,那我要做一个测试啊看一看啊看一看咱们整个呢,这个消息发送行不行啊,这个消息发送行不行,对吧?注意这个时候和我们现在Z贝斯的告警就没关系了,由谁来做,由瑞向云来做,那么如果瑞向云的话,那么他把消息发送给谁呢?那么咱们刚才在配置分派策略的时候,是不是发送给我们现在对吧?我当前的注册邮箱啊,对吧?那我注册邮箱呢,那应该是我163的邮箱,和QQ邮箱就没关系了,原来Z发送的话是发送到QQ邮箱的,对吧?那么咱试一试同学们来,那么我现在呢,来看一下啊,目前三个节点data note都是启动着的,然后接下来呢,我们去停止HDMS服务。
06:46
把这个服务呢,我们来停一下看效果啊。来,那么咱们现在呢,这个服务停掉了,对吧?那么停掉之后呢,大家可以来看一看,咱们现在呢,整个是不是发送邮件了,对吧,是不是发送邮件了,来那么来到我们现在呢,他的一个网易邮箱中啊,来到网易邮箱中是吧?那么要稍等一下。
07:11
那么来到咱们邮箱中之后呢,大家可以看到对吧?那么咱们这里呢,他收到了一个告警邮件啊,收到一个告警邮件,那么这个告警邮件呢,点进去注意啊,同学们,原来咱们这个配在搭配的时候,我们是不是啊,使用的是我们163的邮箱来作为我们这个发件人啊发件呢是用163邮箱,所以发件人然后收件呢,是我们配置的是吧?收件是我们配置的这个QQ邮箱对吧?那现在呢,你来看同学们,咱们当前呢,把这邮件点进去,那么这个发件人是谁呢?这个发件人是瑞向云了。对吧,这个发件人瑞小云,然后接下来收件人是我们注册瑞小云的这个用户是吧?当然你也可以配置其他用户是吧?然后接下来告诉你现在呢,在咱们这里同学们,那我们这个四是吧,那么它呢,发生了我们的故障,然后收到它的一个告警是吧,收到一个告警是吧,那整个呢,咱们现在同学们,那么这块关于我们对吧,这个data notde对吧,Data note它的一个监控呢,这就完事了,然后接下来,那么你现在呢,来到我们这里同学们,那你可以看到啊,关于grana这个做监控,那么gra的做监控呢,原来这里边是不是每台是不是都由我们现在这个一个呀,那每台啊都由我们现在一个进程,现在进程呢也变成零了,所以展示效果呢,我们也可以看到了啊,格兰的做展示就也OK了,然后呢,咱们现在在我们这里边它的一个告警啊,它的一告警,我们现在呢,那也收到了,你看这慢慢的,因为它有延迟嘛,对吧,同学们,咱们现在呢,在这里它的一个二这也过了,还有一个三对吧,还有一个三对吧,那么咱整个。
08:46
这呢,这个就完事了啊同学们,呃,那么咱们现在呢,把这个停一停。
我来说两句