00:00
好,今天我们来聊一下腾讯云监控产品的一个全家桶的一个介绍。那今天呢,我们主要介绍三块,首先来聊一下什么是云监控,然后紧接着来聊一下这个云监控相关产品的一个架构,最后来介绍一下开源产品和云产品的一个区别,这也是网友最关心的一个问题。好,我们首先来看一下什么是云监控,那我这边码了一行字哈,那我就不去读了哈,那其实云监控呢,就是一个统一的监控平台,那他在我们这个整个呃,云。你在服务器在玩云的过程中呢,是最重要一个环节,那它可以监控你所有的这种云的资源,那就包含了云服务器对吧,数据库啊等等这些资源,那通过云监控的话,可以全面了解你的这个服务的一个健康的状态,同时呢,还是一些其他功能,比如说用户非常关心的这个代报的报表的一些功能,对吧?那这个截图呢,其实就是我截取的一个服务器的一个,呃,云监控数据,那我们可以在这个数据上可以看到有这CPU啊的指标监控C就包含了这个利用率和基本的C使用。
01:04
的一些指标,包含包含内存啊,内网带宽还有外网带宽,那这个指标呢,其实是非常多的哈,那这个指标呢,还有这个时间,比如说你可以看到到实时的,看到近24小时的,看到最近七天的这样一个数据。那数据还是比较全的哈,那这就是一个云监控啊。在我们往下聊之前呢,我们来先来聊一个话题啊,就是诶我们为什么要呃去做监控,那监控的一个重要意义就是什么呢?那我这里抽象了三点哈,那刚刚其实已经说了,云监控是非常重要的哈,那他是可以知道你整个这个服务的一个健康状态的,我们要是购买一个服务的话啊,最重要的第一点就要啊提前规划好就是啊,设置好你的云监控啊。把报表都设置好,那他的一个重要意义是什么呢?其实就是在发生前呢,能提前预警将要发生的问题在哪,那在问题发生过程中呢,能够快速定位这个问题发生的位置啊。因为有的时候你的集群非常大对吧,然后有接入逻辑存储,可能上百台服务器,那有一台服器低B挂了,你可以通过监控啊,快速的发现是哪台服务器有问题,因为本身硬件就是啊不可靠的哈,所以我们通过监控是可以快速定位的,那问题发生后的话,我们可以通过这个啊监控的数据呢,能来复盘啊,规避这个问题再次发生啊。
02:19
这是监控的这个重要的意义。好,那我们来看一下这个云监控的一个整体的架构啊,那这是一个整体的一个架构图,那我们可以从下往上来看啊,那最下边的话是S基础的监控,那S也就是基础设施的一个监控,那我们可以了解哈,基础设施就包含了这种啊。这个叉八六的服务器,那叉八六的服务器上面无非跑着就是两种操作系统啊,就是主流的操作系统,一个是Linux,一个是Windows,对吧?那Linux和Windows的话,不管哪个操作系统,它都会有一些基础指标,比如CPU,内存,网卡和磁盘O,那这个数据呢,都会上报到云监控,当有问题的话,通过这个统一告警都会告知给用户,那pass是什么呢?Pass就啊服务啊。
03:03
这个是比如说MYL对吧,就是一个pass服务啊,平台技服啊。MY。Service对吧,都是有啊这个平台的服务的产品,那如果你买了一台云主机,又买了一个MYS的话,那这些数据呢,都会通过不同维度的形式啊,上报到云监控。那聊了这个啊,基础监控以后呢,我们再来看一下上面这个截图哈,那我们可以看到这里有一个云服务器啊,我们所有的云服务器中呢,都有一个agent,我们在买这个服务器的时候,会有一个啊免费购买这个云监控的一个挑那个挑一定要挑上,你挑上那个条以后呢,你在服务器在安装的时候呢,会去自动帮你安装好这个agent,通过这个agent来采集你。啊,云主机上的一些啊,数据上报到服务器上啊。除了这个,呃,下边这个监控以以外呢,这里边儿还有几几个监控,就是这个业务的监控啊。业务维度的监控,日志的监控啊,调用链的监控,对吧。那日志业务的监控的话,就比如说你啊,你的应用程序打了一些啊这种日日志,日志里就包含了几个重要指标,比如说成功率啊失败率和啊延迟时间,对吧,这是这三个重要指标,那它也是一个业务的一个核心的指标,那它可以通过云监控啊上报上来,呃,业务监控上报上来,通过统一告警触达给用户。
04:21
那还有这个日志服务对吧,可以监控这个关键字对吧?还有这种当前比较流行的这调用链监控,那用户一个请求进到你的服务器以后呢,这个调用链监控可以看到用户在每一个环节啊耗的时间是多少,那有这个数据以后,你有针对性去优化的系统,那这个呃,云播测是什么呢?云播测其实是一个黑客监控啊,那我们当前的服务器,比如说这个服务器我启动了一个阿帕奇,那阿帕奇的后端呢,又连接了一个MYQ,那MYQ一旦挂的话。阿帕奇的八零端口还是正常运行的,对吧?所以云波测就是一个黑盒监控,它会探测你的这个八零端口,比如说你可以在你的程序里边写一个这种API,对吧?去检测后端的数据库,如果后端数据库是正常的话,那你的接口就突出来一个正常,如果异常的话,突来一个失败,所以云波测可以根据你的接口的返回啊的内容来。
05:11
判断这个整体的业务是否正常,那这也叫这个黑盒监控,如果要是有异常的情况,也是通过这个啊统一告警平台触达给用户,那大家可以看到啊,那整个云监控的所有的产品的话,都是可以通过这个统一告警平台啊触达给用户的哈,有这样一个能力。这是云监控的一个整体的架构。好,聊完这个整体架构以后呢,我们再来看一下这个单独,比如说云监控,我们直接点击这个URL,这个链接就进入到了云监控的一个控制台哈。我在家网速有点慢啊,我们直接先来看这个云监控的功能,就是整个云监控功能的一个架构图。那我们可以看到云监控支持这个啊,云产品的监控,那云产品的监控的话,就包含了这种数据的展示,数据的下载,数据的定义订阅啊智能监控和腾讯云API3.0。
06:05
比如说你除了在控制台上可以看到这个监控数据以外呢,你也可以通过这个,呃,腾讯云的API3.0调用到这个监控数据,然后做这种二次加工,做这种告警,这是一个主要的功能,再就是这个报啊,报就是报表对吧,报表就包含自定义报表,大屏报表对吧?日志监控,自定义绘图,多指标展示,那我们不可能时时刻刻啊你。比如说有一个庞大的集群,对吧,你不可能时时刻刻这个都登录到这个云监控系统上,那但是呢,你可以比如说呃,像我们运维部门有这个部门前面有很大的一个这个电视,电视上呢,展示的就是这个代视报的啊,这个代视报的其实是可以取决于这个云监控的啊,当前云监控已经打开了,我们可以看到这有个大报的一个报表哈,那这个报表呢,你可以在这里边去配置一些监控的视图,对吧?那同时呢,你可以把这个数据呢,展示到一个大的屏幕上,供所有人去看啊,因为我们当我当前这个呃数据是这是一个测试账号,没有数据,所以这里是空的。
07:06
那这是这个DA报,那自定义监控的话,其实就是除了这个啊公共的监控,什么是公共监控,比如说啊,刚刚说啊,我们现在跑的是叉巴拉服务器,叉八拉服务器上运行的是最常见的超系统Linux和Windows,那这个Windows和Linux的话,所有的服务器都有统一这个指标,对吧?比如说啊CPU,内存,网卡和磁盘,那除了这些基础指标以外呢,比如说你程序也会打一些啊,你自己知道的一些字段,比如说key是什么意思,Value是什么意思,那你可以通过这个自动定。自定义告警的方式,自定义监控的方式,上报到云监控啊,满足你这个监控丰富度的一个需求,那再就是事件告警,事件告警就变包含了这种平台事件,产品事件,比如平台,比如说哪个地区的啊,网络异常他通知你,那这里就是叫平台事件对吧?那还有这种告警对吧?除了这种监控以外呢,还支持这个告警的功能,告警就包含有这种啊订阅呀,啊告警的历史查看呢,模板啊等等信息哈,那除了上面这以外呢,还有这种流量的监控,实例的监控和日志的监控,这个整体构成了语音监控的这个大产品。
08:12
这是云监控,那我们再来看一下云播测哈,那云播测的话,其实刚刚有聊到,其实就是一个黑盒监控,那我个人认为它是非常重要的一个监控啊,那腾讯云的云播测的话是一个免费的系统啊,它应用的是这个腾讯云的CDN啊CDN在部署在全球各个节点的一个啊服务器来同时P或者是连接你的这个个人的服务器啊,通过这个链路啊来算这个质量,当出现异常的时候会告你。那云拨测的话就支持了这些功能啊,比如张姐点的拨测,业务能力的拨测,域名的拨测和多多种协议的一个监测的。这是云拨测。那最后的话,这个就是这个日志监控啊,日志监控,那日志监控的话,从那个流程图我们可以看到,那在腾讯的话,也有很多这种产品,比如QQ啊,音乐啊,微信啊都会使用到这个日志监控,那日志监控呢,在腾讯呢,就叫CLS,那点击这个CLS可以进到这个控制台哈。
09:10
网速的原因哈,我们稍等来跳过去看一下。那呃,上报流程其实就是在你的机器上装一个agent对吧,去监听你的日志目录的日志,然后把你的日志呢,实时的啊,通过这个整个流程啊,上报到这个系统上啊,那在腾讯云的话,存储包含两种啊,但是对于用户来说是透明的,一种是自研的存储啊,它的性能更强啊,存储成本更低啊,但是它有一些啊。不足的地方,比如说不支持这种聚类对吧,那下边的话是这个开源的这种存储就是search对吧?Search,但是它的成本是相对来说比较高一些。那这是整个日志监控,那我们可以看到啊,这个这是日志监控的一个。控制台哈控制台。有需要的话也可以使用这个产品。就是日志监控,那最后的话,我们再聊一下这个,呃,开源产品和云产品的一个区别,那其实很多当前很多这个呃云产品啊,是可以使用这种开源产品来替代的,我这里边展示或者说我对比的一些常用的啊,监控产品和开源产品的一个对比,大家可以啊来点击这个UR来看一下哈,那对于企业来说,这个开源产品和云产品最大的几点不同,就这三点啊,我抽象了这三点哈,当然如果你要是有更多的这种啊建议的话,你可以在我视频下方留言哈,我可以来更新这个讲义,这个讲义呢,也会放在我视频的下方,那首先第一点的话就是开源产品的一个迭代。
10:37
嗯,开心产品。更新迭代。更快啊,需要专业人员来维护啊操作,那比如说你这个开源产品啊。你需要更多的功能支持,但是呢,你就需要升级更新的版本,那你升级更新版本的话,就需要有专业来专业的人来维护这个开源的产品啊。这是需要啊呃,专业专专维护的哈,是有这个人力的成本,那但是腾讯云的话就是会自动帮你去升级对吧,这个是节约了这个人力的成本,那第二个的话就是呃云产品提供的这种丰富的控制台,对吧?然后产品的使用经验都融入了控台,也就是说呃,腾讯云在使用这些产品的时候呢。
11:18
他呃,比如使用监控的时候呢,也会把自己的一些业务,内部的一些业务放到这个云监控上,然后通过内部的业务啊的一些需求来打磨这个产品,让这个产品的功能丰富度更强啊,这就是说腾讯云提供更丰富功能更丰富的控制台啊,有内部业务的一些支撑,再就是啊,无需啊,企业无需养这个运维人员,这就是刚刚说的这点啊,那最后的话就是你。的,随着你的企业的规模变得越来越大,你使用产品。呃,云产品的话将会越来越划算,其实也是规模效应,那你的。盘子越来越大,然后你的成本就会逐渐的变低。其实最呃,现实中最。那说明这个案例的例子的话,就是健身房对吧,健身房面积就是比如说是200平啊,你卖给的人越多啊,你的啊。
12:08
你的成本就会不断的下降,对吧,因为不可能所有的人在同一时间都去健身房啊,你是可以做超卖的啊。所以这个云产品也是一样哈,你的规模越大,那使用云产品其实是越划算的。那这就是开源产品和这个云产品的一些啊区别,我整理的嗯。那这节课的话就是啊,介绍这些。如果你喜欢这个视频,也欢迎在视频的下方点赞关注加评论,谢谢观看。
我来说两句