00:00
各位同学大家好,今天给大家介绍一套由普罗米修斯加格娜加瑞向云实现了一套监控报警系统。那我们都知道,大数据主要解决的问题呢,是海量数据的存储。传输以及啊,我们这个分析计算。那么咱们前面呢,在介绍我们这个分析计算的时候,其实主要有两种实验场景,一个呢是离线。一个呢是实时。那不管是离线也好,实时也好,那么咱们真正再去运行的时候呢,都需要把我们的应用提交到服务器的环境去执行,比如说在咱们真正执行的时候,这两个东西它呢,应该是在我们这个服务器啊上去执行的。那么在执行的过程中,对于我们的服务器啊,那相关的一些我们指标来进行监控,这个呢就非常重要了啊,因为我现在如果要想保证公司的线上业务能够整体平稳的运行的话,那我们需要去关注它的各项指标是不是正常。
01:00
啊,而一个咱们业务系统背后呢,往往存在很多指标需要咱们去监控,比如说我现在在咱整个的这个环境中,有我们这个服务器,是有我们的网络设备,有硬件资源,有数据库,包括我应用程序本身,对吧,那我们怎么样能够更加方便的集中的监控他们呢?那这个时候呀,就需要我们运用一些啊第三方的一些工具,比如说我们现在呢,常见的像什么ZS。大家在离线里边应该用的是我们这个拉,就是做监控,那么还有一个是我们这门课程呢,给大家介绍的普米修斯。啊,那我们现在监控啊,它的一个主要的目目标或者初衷啊,就是说当有一些我们一个服务器的指标不符合我们的需求的时候,或者说到他这么样运行下去是吧,那肯定早晚会出问题的时候是吧,那我们监控工具呢,那应该啊把这些问题呢给收集起来,然后及时的做一个展现或者报警,通知相关的责任人。
02:02
并且把这些呢异常给记录下来。那么我现在监控工具它本身呢,那具备我们这个异常信息的采集存储和展示的功能,但是呢,对吧,那一般我们这个监控器本身这功能呢,相比相比较起来呢,对吧,这个监控可以,但是如果说让他去做我们这个展现和做我们的报警的话,相比较起来呢,要弱一些,所以说呢,咱们除了用普罗米修斯来做展现啊,来做来做我们这个监控之外,那我们的这个展现用na,我们的报警呢用瑞向云。对吧,这个呢,其实是我们整个这套监控系统,它大概的一个对吧,这样流程,我现在呢,把这套这个思路给大家简单的画一下啊,把这个思路简单给大家画一下,首先呢,同学们,咱们现在呢,在这里我们知道我们呢,不管是离线也好,那实时也好,那咱们呢,那这里可能是我们自己写的一个应用程序啊。
03:00
拿这个吧。这个是我们这个离线。或者说是我们的一个实时应用。这里稍微放大一点。那么你现在呢,要把这应用程序放在什么地方呢?那我说这个应用程序呢,要执行的话,那我应该呢,去把它放到我们这个服务器上去执行,所以说呢,这个是我们这个服务器对吧?但是和服务器相关的呢,那肯定对,那有很多对吧,这个比如说我们这个数据库服务器啊,对吧,然后呢,比如说咱们这外部服务器啊对吧,哎等等对吧,所以说呢,我们现在呢,这整个啊,我们这个就叫环境吧,是吧,叫执行环境,也就说我现在这个程序要执行,那你得把它放到我们对应的执行环境里边去啊哎,那这个呢,我们的执行底层啊,这个呢是我现在它的执行环境。
04:00
那么你这个执行环境到底执行的正不正常,有没有什么问题呀?那我需要呢,对我们当前的执行环境来做个监控,那么谁来做这个监控呢?那我们现在选用的监控组件是普罗米修斯。在这里我们现在呢,选择一个监控组件,那么这个监控组件呢,咱们用的是我们这个普罗米修斯来把这个连一下啊。好了,这个是使用普罗米修斯来做咱们现在的这个监控,那么普罗米修斯如果做监控的话,他会从我们这个环境里边是吧,定期的去采集一些我们信息过来是吧,把一些我们的数据呢给收藏过来,比如说什么CPU的情况呀,对吧,内存的情况呀,你的执行的一些是吧,我们这个运行情况是吧,等等它呢,可以通过pro米米斯给收集过来是吧?那么如果一旦发生异常情况的话,那我需要呢,哎,把这异常情况做一个报警,并且呢,把收集的情况呢做一个展现,其实普罗米修斯本身呢,它是有这样的功能的,它可以做展现,那也可以呢做咱们报警,但是呢,除了我们现在这个监控采集之外,它的展现和报警功能呢,相对起来要弱一些,所以说呢,咱们在这里对吧,我们呢,又做了一个集成啊,又做了集成,那么做一个什么样集成呢?我们这里展现啊,我们用的不是不是promise本身了,对吧,那我们。
05:36
这里展现的用的是grana。用它呢来做展现,它是一个专门做展现的一个组件是吧,那除了我们现在呢,这个展现之外,那还有是吧,那我现在要干啥呢?我现在要做我的报警,那这个报警呢,那我们现在也是用第三方组件,那么这个组件呢,我们是用的瑞向云。
06:02
好了,那么整个通过咱们的pro米斯加graph呢,加咱瑞向云他们三个结合起来,那么其实呢,就能够形成一套比较完整的监控报警系统,对吧?普罗米修斯呢,他负责去做我们现在数据的采集,或者指标它的一个采集,然后我们现在呢,在gra里边来做我们现在它的一个展现。然后咱们这个瑞向云呢,它主要做的是我们这个报警啊,诶每一个我们的组件呢,各司其职,好了,这个呢,是我们现在这个整个课程啊,他大概的介绍。
我来说两句