00:01
呃,普米斯安装完毕之后呢,那么接下来咱们啊来看一看,那么我们呢,去安装一下其他的一些组件对吧,包括push getway,然后alert manager以及呢noportter对吧,那么这些组件的安装,呃,那么先来看一下我们这个push getway对吧?呃,那我说啊这里面有说明说正常情况下呢,采用拉模式,从产生指标的一个作业或者exportter对吧,来去拉取监控数据,但如果说我们现在呢,要监控的类似于弗林港雅恩的这样作业的时候,你要想让他去自动的去发现作业提交的话,那么这个呢是比较困难的,就因为我不知道我当年到底是哪台机器对吧,他去执行我们现在呢他的一个对吧,这个pass manager对吧,那所以说呢,咱们现在可以怎么办呢?对吧,可以让他对吧,去先提交到啊,我们先把当前的对这个产业的指标呢,先推到我们这个网关上,然后呢,你从网。
01:01
对吧,来去拉取数据对吧,相当于做的多做了一步对吧?那所以说呢,那咱们现在要想去使用这种方式去拉取数据的话,那你需要把push get way呢给它安装一下,对吧?那么具体安装的过程,首先第一个对吧,还是去上传我们这个安装文件,这个已经上传好了,刚才咱们看到了对吧,咱们呢直接解压对吧,来到这个呢,同学们,我也不带着大家写了,来到这里,我们呢去找到我们这个software。是吧,那么到我的S下边呢,那么咱们呢,去解压我们当前push get way安装文件,解压到我们这个OPT model下边,那么解压完毕之后呢,咱们来到我们这个model下啊,那你可以看到这里多了一个我们这个push get way。然后给它呢,去重命名一下啊,咱们直接把它呢做一个重命名是吧,那那目前咱们现在呢,来得到一个这样的一个目录,那么进入到我们这目录里边,咱们可以简单的去看一下这个目录结构是吧?那这里呢也是啊,就一个可执行程序啊,就一可定行程序,它是不是就比较简单了,连个配置文件是不是都没有啊对吧?哎,那这个push是get be啊,就安装好了对吧?那么咱们现在呢,先把它安装讲完一会咱们一块来看启动同学们,那么安装完它之后呢,那其实我们对于目前我的程序来讲,如果我想监控我们这个弗link应用程序的话,那么安装这俩其实就够了,一个是普罗米修斯它的核心服务,那么另外一个呢,是我们这个push getway这种方式呢,对数据做采集,那么咱们现在呢,有两个可选的安装,那这块呢,咱们也给说一下对吧,那么一个是alert manager对吧,那么咱们来看我的架构同学们,那么再来整个的架构的这里面说明的时候呢,那我们说这个A。
02:52
Manager它的一个主要作用是干啥呢?对吧?那它主要呢是对接配置啊dirty的对吧?那么是一套付费的监控报警系统,也就是说它本身提供了这样的一个告警模块,然后呢,这个告警的对接我们现在这个组件对吧?那么可以实现我们的个短信,然后呢,以及打电话发邮件等等对吧?诶那么这块咱们呢,报警不用它,但是我把它呢也给装上啊,我把它给装上对吧?大家也可以简单看一看它的配置对吧?那么具体的安装呢,也比较简单,直接来到我们这个S下边,刚才我已经把安装文件上传过去了,然后也是解压改名就可以,对吧?来把刚才的步骤呢,咱们再去重新执行一下,来到我们的software下边,然后呢,去重新解压一下我们的alert manager到我们的OPT model,然后接下来来到我们这model目录下边,咱们呢,去把当前呢这个重新的去改一下名啊,把咱们这个重新改一下名啊。
03:54
好了,那么改完名之后呢,那么咱们可以看到啊,来进入到我们这个alert这个目录里边,那么你可以看到在咱们这里边,除了我们现在它的一个啊这个可执文件之外,还有一个配置文件,那么你现在呢,打开我的配置文件啊,你可以看一看,在咱们当前配置文件里边,那么它这里边呢,其实就有一些我们的报警规则了啊吧,那么具体我现在呢,对吧?这些报警那输出的什么位置对吧?那么其实这里边呢,它有一些报警规则对吧?那么这块呢,咱们后边对吧,在亚瑞校云集成的时候呢,再说对吧?哎,那么这块呢,是我当前它的一个报警组件安装对吧?那么报警组件安装完之后呢,最后呢,那其实就是我们现在这个porter,这个也是选择性安装的,对吧,因为我们现在呢,是通过push getway的方式来获取数据,对吧,那么你可以选择性的把它给安装一下,对吧,那么你要想去安装它的话,同学们,那么大概是吧,这个大大致的步骤呢,和它前面一样,对吧,也是第一个来到。
04:55
到我们这里去解压啊,把我们当前的这个压缩包解压到我们这个op的猫的下面,然后来到我们这个猫的下面呢,咱们去改个名字啊,把这个名字呢去改一改。
05:12
来改个名,那么改完名之后呢,同学们,那么这里你可以看到这里有个noteportter对吧?那么咱们进入到我这个noteporter里边来对吧?那么咱们其实到这了,可以简单的看一看,说那我现在这已经啊把我们这个exporter对吧给它安装好了对吧?它是干啥的?他们就直接从某一个我们这个节点上来获取我们这个数据吗?对,来监控某个节点吗?对吧?那么咱们现在能不能达到监控的作用呢?同学们注意啊,这个pro的好处什么?它的好处是我想监控我们这个服务器对吧?那么你不需要服务器它本身做什么事对吧?你只需要把咱们当前的ex porter给它扔过去对吧?那么这个ex porter呢,它就可以采集到咱们服务器相关的一些我们的指标数据,对吧,那么这个咱们其实可以看一看,对吧,那么怎么看呢?咱们就启动一下我们当前的这个node exportter,对吧?在我这里边有个可执行的我们这个命令叫nodeportter,那么。
06:12
启动一下,那么启动完毕之后呢,在咱们这里边对吧?那我们现在呢,你可以看到对吧?那么咱们现在在这里对吧?那已经启动成功了,那么启动完毕之后呢,大家可以来到我们这里,在浏览器中呢,去输入我们现在的地址是吧?在浏览器里边来去输入地址是吧?来看一看能不能够啊,发现我现在的指标大家可以看到啊,在这里是吧?那我们这个ex exper它的一个默认端口号呢,是9100是吧?然后接下来那么你现在监控它的话,那么你可以看到当前202这台服务器上,它所有的监控指标都给你拿出来了啊,通过exporter可以把这些指标呢拿到对吧?那咱们到时候我在普罗米修斯再一启动的话,它就可以从咱们当前这个这这这个这个这个ER里边来把这些指标呢给拿到,等拿到之后呢,存到我们的TSDB里边去,然后呢,对他做一个我们的分析啊计算,那如果哪些指标呢,不太正常的话,那么咱们做一个告警。
07:11
啊哎,其实就是这样一个过程啊,其实这样过程好了,同学们,那这样的话呢,关于我们现在呢,它的一个啊安装啊,这几个安装就完事了,对吧?那么咱们这安装的这个是刚才我这节点呢,它是其在一台机器里装的,但这里有一个问题什么呢?说你要监控的话,那有可能监控的是多个节点对吧?那如果监控多个节点的话呢,那我需要做一个我的分发,所以说呢,那么来到我们这个猫的下边,然后呢,咱们通过我们这个分发啊脚本发命令对吧?来把我们这个node exportter给它分发到我们203和204这去,对吧?那分发完毕之后呢,那么在这里注意同学们,那么你要想从202203204来获取a po数据的话,那么这个时候呢,你在普尔米斯配置文件里边,对吧,那你要添加这样的配置,这个咱们前面已经添加过了啊,你可以看一眼对吧,来到普尔米修斯,然后找到它的一个普尔米修斯。
08:12
它的一个配置文件在咱们这里边,你看同学们,咱们是不是啊,在获取数据来源的时候,这两种方式我都配了呀,一个呢,是从咱们note porter这三个节点上来获取端口号呢,9100,那另外一个呢,是从我们的push getway来拉取数据,端口号呢,它是9091啊,端号9091,好了,把这个配置完毕之后呢,同学们,那么我们想你要想去监控我们的节点的话,你不能每次对吧,在咱们这个,呃,想监控的时候,你单独去启它,你看什么时候开始监控呢?是不是我这个节点启动的时候,然后你就开始对着节点做监控啊,那意味着什么呢?意味着是我希望啊,我当前这个node exportter它呢是可以开机自启动的。对吧,那就说开机自启动,同学们,咱们前面可能说,诶,那比如说买circleq的它的一个服务,那我可以把这开机自启动给拿过来,但是我现在这里并不是一个服务啊,那么怎么做成开机自己弄的对吧?同学们像这种情况的话,那其实你到网上一搜对吧?这有很多详细的步骤对吧?那么咱们呢,其实这种东西你也没必要去记,对吧?那我按照这个步骤来,我要想把当前呢,我们这个note porter啊来设置为开机自启动的话,那么这个时候呢,咱们是吧,那需要去创建一个service这样的文件,对吧?来CTRLC拿过来。
09:34
在咱们这个user Li system这个目录下边创建一个这样的一个我的文件啊,那么在这里呢,我输入密码啊。这个因为我我以前创建过同学们对吧,那么正常情况下,你们这个文件里边这应该是空的啊,应该是空的对吧?然后在咱文件里边呢,你去加我们现在呢这些内容,把我这里边这些东西拷贝过去给它加上对吧?那么加完之后呢,别忘了把它去给分发一下啊,把给分发一下,然后分发完毕之后呢,那你就可以像操作我们像什么买SQLD啊这个服务一样,然后呢,让我们这个服务呢,也作为我们这个开机自启的一个服务就可以了,对吧?那因为我现在呢,前面我做过,所以说刚才启动的时候呢,不知道有同学注意过没有,对吧,为什么呢?其实我现在在咱们这里边对吧,那我这里边他是不是告诉你已经啊,有你这这个东西在用了,就相当于我在开机的时候呢,起了一个这样的服务,对吧?哎,那么咱们现在呢,在这儿同学们对吧?那我要想去启动它的话,那这个时候咱们去怎么做呢?那你可以这样啊,把我现在呢这句话给拿过来啊,开机自启啊,咱们把这个东西拿过来,那我应该再拿这。
10:47
三台机子都有的是吧,比如说我现在再来台机器203啊,203里边呢,那我也是是吧,把它给开启,开机启动,然后呢,我现在去启动一下啊,我查了一下的状态,不是enable,然后呢,Stay是吧,查一下它状态,大家看这东西是不是已经在运行着了呀,是吧?开机这服务呢就提起来了,然后开机这服务器提起来了,那204呢,这里应该也是对吧,那我现在呢,去查看它的一个状态对吧,那在这里。
11:19
对吧,大家可以看到这个东西呢,它也在运行的,对吧?那么如果说这个东西在运行的话,同学们,那么这个时候呢,那你再去查找的时候,那这里零三对吧,那么零四这几台机器呢,它的一个相关指标你应该都可以看得到,那这几台机器相关指标呢,那应该都可以看得到,好了,那么这个呢,是关于我们现在这个put get way,然后呢,以及我们这个nodeportter这两种采集组件,它的安装,以及呢,一个报警alert manager它的一个安装是吧,把这个停一下。
我来说两句