00:00
好,同学们,这个内网穿透呢,我们配通之后呢,呃,就需要去配一下我们的业务可用性检查,所谓业务可用性检查呢,是指我们的业务系统目前可不可用,呃,对于我们这个PPT上呢,其实也就是瑞向云呢,呃,在瑞向云呢,去配置一下,让他呢定时去访问我们的URL,去检查一下这条链路呢通不通啊,可不可用。接下来呢,回到我们瑞向云的首页。刚才呢,我们是在智能告警平台给大家配了一个集成的告警。呃,可以看到刚才呢,是在这里做了一个发DB对接。而现在呢,我们不要去这个智能管理平台,在它下面呢,有一个业务可用性监测平台,点击这个。好,可以看到呢,这里面其实是一个各种监控啊,也可以看看这个PIN监控,单页面监控,DNS监控,其实呢,这个就是配置啊,让我们的这个瑞向云呢,去定时的哎,聘一些你的服务啊,或者说是呢,去看你的这个页面呢,能不能用啊,包括这个右边呢,还有这个API监控,接下来呢,我们去弄一下。
01:08
首先呢,点击右边有一个绿色的按钮,叫做创建监控。好,可以看到呢,这是一个页面,那么一上来这个呢,是让你选择一个监控类型啊,点击这个下拉菜单,我们可以看到有好几个啊,这里呢,我们选择API监控。呃,监控的名称呢,给一个就叫in inlux DB,健康状况好监控的地址呢,去我们的花生壳里面啊,或者我们刚才这个页面啊,直接把这个映射到的地址拿来。哎,现在回到这个瑞香云。之前呢,我们给大家给大家看过一个API post啊,在API post里面呢,我们去试过一个API啊,叫做health,那么这个API呢,可以看到我们啊in DB的健康情况,把这个路径呢,给它拿过来。
02:03
好,那么接下来呢,我们可以拿来这个地址呢,先去APIPOS里面试一下。新建一个接口。呃,把它改成get请求,把这个地址一粘,发送请求。可以看到现在呢,呃,这个响应的这个消息呢,就是说我们的一发DB已经准备好,呃查询和写入了,呃响应状态码呢是200。呃,接下来呢,我们继续往下看这个设置啊,这个请求头的部分呢,我们就不用再进行设置了。另外一个呢,就是我们的一个响应时间,呃,所谓这里呢,意思就是说在我们请求这个目标的地址的时候呢,哎,这边的响应在多少秒之内响应呢是正常的,超过多少秒呢是异常的。啊,那么可以看到呢,最右边这里它的单位呢是毫秒,我这里面呢,可以给它设置一下啊,如果是5000,就是在五秒内呢响应那就是正常的啊,同样的超过五超过这个5000那就是不正常。
03:01
呃,再点击这个可以看到一个有结果验证,那么这里呢,可以验证我们的响应码,或者内容包含,呃,我们就验证这个响应码,那么响应码呢,如果是200,说明它是健康的。好,再往下有一个监控区域选择啊,这个意思呢,是瑞向云有很多分布在各个省份的服务器,包括这个不同运营商运营的啊个地方呢,看起来不是很舒服啊,我们现在把它页面缩小一下,你会看见是这个样子啊啊那么这个意思呢,就是说啊,你可以对你的这个服务呢,去配置很多的一个服务器,那么这些呢,都是我们啊瑞向云所有的一个服务器,你比如说我配了这个内蒙古,又配了这个河南啊,又配了江苏,又配了广东啊那么这四个省份的服务器呢,就会对你这个提供的URL进行一个访问,那么有的地方的网络可能就访问不通啊,有的时候呢,可能移动的网可以访问不通,电信的网呢就访问不通,所以说呢,这个地方呢,可以好好配置一下,此处呢,我们选择北京啊,我只配一个,我只配一个海淀区。
04:03
好,可以看到我们的这个监控节点列表呢,就只有一个。啊,在上面呢,有一个监控周期的频率的设置啊,那么这个监控频率呢,也就是我们下面的这些服务器啊,每隔多长时间呢,去访问一下你的URL。啊,我们免费版呢,最低的这个,呃,最快的这个间隔呢,就是15分钟,如果说你是付费版的话呢,啊,你可以把这个频率再往下降啊,我们可以看到这里面还有有周期模式之后呢,还有时间模式啊,时间模式呢,就是你设一个开始时间,结束时间,然后呢,在这边再设一下这个间隔,同样的最短的间隔也是15分钟啊意思呢,就是有可能有些服务呢,只是白天可用,晚上不可用。啊,此处呢,我们选择周期模式,设为15分钟就可以了啊,点击保存啊点击保存。啊,他说这个严重缓慢数值必须大于正常数值。而是指我们的这个。延迟呢是刚才设置的不太合适,我们可以看到在这个基础配置里面。
05:04
啊是因为我这个延迟呢,这个缓慢啊应该比它要大,那么把它这个设成呃,1万也就十秒呢,就是属于严重缓慢,5000呢,呃小于5000呢,就属于正常响应,那么5000~1万之间呢,它可能自己有一个呃响应级别的定义啊,点击保存。可以看到我们现在呢,已经成功创建了这个监控。好,我们返回监控列表。好,那么现在可以看到呢,我们有一个,呃,监控列表里面呢,就躺着我们刚才创建的这一个啊,名称为in Fla DB健康状况的一个监控任务啊,那么现在可以看到呢,这个监控任务的内容呢,链接也在这儿啊,还注意呢,我们之前配这个health的时候呢,没有配talking,因为这个啊health这个URL呢,不需要talking就可以访问。呃,接下来呢,可以看到右边有一个平均响应时间和响应性啊,100%啊这意思呢,就是说他刚才呢,在我们创建的时候呢,已经开始对我们的呃,这个目标的URL发送请求了,我们可以看一下,点一下右边这个查看。
06:11
好,你可以看到这里面呢,它就我们测试的次数,然后再注意呢,就是我们现在这一个面板啊,现在这个面板它有一个时间的限定,可以看到它是5.01分到,哎,五点半的这么一个时间段的呃情况,所以说呢,这个面板呢,现在只是展示的这半小时里面一个运作的情况,随着我们这个任务呢,越跑越长,你可以通过这个按钮呢啊,去看你想关注的时间时间段。啊,另外呢,可以看到,那么这里面就在过去半小时呢,我们的可用率是100%,可用率是怎么算的呢?啊,首先呢,是在这个时间段下,比如说过去半小时啊,假如说过去半小时我发了十次请求。啊,然后呢,有八次是通的,有两次是失败的,那么在过去半小时的可用率呢,就是80%。啊,那么这就是可用率的一个算法啊,在下面呢,还有一个错误率,如果说呢,我们这里有个请求失败呢,它会把这个错误的情况呢给记下来啊,可以看到呢,这个下面的这个坐标轴,它告诉你是HTTP错误,还是网络故障,还是超时错误等等等等啊,它会把这个错误的结果呢原因啊都给你抄录下来,另外呢,在左边可以看到啊,这里面有个地图表示我们从各个地方呢去访问我们的服务的一个延迟情况,呃,其中可以看到,因为我们现在只配了一个服务器,鼠标悬停在北京的时候呢,可以看到总体平均是78毫秒啊,我们只选了一个移动服务器啊,78毫秒呢,就可以得到这个响应啊,然后呢,可以看到我们刚才规定的一个5000毫秒和1万毫秒的阈值啊,那么它呢,实际上是成了一个三个分类的一个图,小于5000呢,就是正常啊,5000~1万之间呢,那就是呃,我们说的缓慢,然后大于1万呢,就是非澈慢。
07:53
啊,再往下看,包括各个任务的情况,他都给你展示出来了啊,那么这就是我们一个监控的面板啊,最后呢,大家可以看一下,在右上角有一个点次信息点一下啊,那么这里面呢,是我们啊还剩的一个请求次数啊,包括这个消耗的一个点数啊这个呢很便宜,而且呢,现在这个1000次呢,是我们的免费额度,大家呢,测试环境下用就可以。
08:18
啊好的,那么现在呢,我们整个的一个啊去监控的任务呢,就配置完了,业务可用性监测的任务就配置完了,最后回到我们的列表,可以看到呢,这里面记录了我们发送请求的次数的一个信息,啊这里呢是拨测次数一次,然后呢,我们的API监控拨测次数一次,说明我们刚才配的这个呢,就属于API监控。
我来说两句