首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

多维度立体化监控,才是真的监控

监控这个topic本来有很多细节可以聊,既然大伙公司都做得比较完善,后续就不纠细节了,聊聊方向上的思考,架构上的设计。今天和大伙聊聊多维度立体化监控。...一、什么是多维度立体化监控 不同公司或多或少有一些自动化监控手段,除了前文提到的: http接口监控 log关键字监控 还有很多维度的监控: 操作系统,进程,端口 http状态码 服务存活性 接口处理时间...RPC接口监控 用户层面监控 如果只监控一个或少数几个维度: 监控到异常时,基本确信系统出现了问题 反过来,没有监控到异常,不能确信系统没有问题 例如: 监控到操作系统CPU100%,系统大概率出现了问题...,数据库连接拿不到,服务层每个接口都很快返回,并不超时 … 这里的观点是:单维度监控易漏报,多维度立体化监控才是监控平台的根本之道。...六、总结 监控是一个技术活,并不是大家评论里说的“搭一个ELK就搞定了,何必这么麻烦”: 监控平台的思路是多维度立体化监控 “统一操作系统、http404,服务存活性,接口处理时间”等四大类统一监控的设计核心是

2.8K90

海量存储第二弹 - 立体化监控

二、开源监控产品能否应对 图2形形色色的开源监控产品 目前市面上已有不少开源的监控产品,譬如Nagios、Zabbix、Open-Falcon等,这些开源的监控系统功能不少,能否满足我们的需求呢...开源的监控产品本身提供的功能更聚焦于系统自身的特性监控,譬如主机是否存活、网卡流量等,而像业务特性,譬如业务请求失败数、延时等特性数据就需要单独开发插件,且当生产机位于全球各地、跨越不同运营商的时候,开源的监控在代理...三、我们业务监控的体系建设 图3监控需解决问题的形象描述 关于单台机器自身相关的各种特性的监控,譬如CPU、网卡、硬盘故障、单机不可用等,这部分与业务监控相关性不大,统一采用公司的TMP系统做监控...采用了上述模型之后,后续业务模块增加新的功能,可以直接上报新的维度、指标,不需要人工重新配置监控系统,监控系统会自动识别上报的内容并应用到系统上面,大大降低人工的参与度。...图8业务全路径布控 在业务监控方面,我们对业务的全路径进行布控,监控点部署在用户访问路径的各个层,以保证任何一个层的异常都能及时有效的发现,通过高效的监控系统,以及全路径的布控,我们目前的异常主动发现率已可达到

1.7K30
您找到你想要的搜索结果了吗?
是的
没有找到

创业公司快速搭建立体化监控之路(WOT2016)

本文内容:创业型公司如何快速搭建可扩展,可落地的立体化监控平台 一、需求缘起 创业型公司有系统监控么?...今天的主题是“创业型公司如何快速解决这两个问题” 二、解决方案:立体化监控 怎么知道系统运行是否正常? 回答:监控 什么是立体化监控? 回答:多维度监控 监控维度有哪些?...回答:(1)机器、操作系统层面 (2)进程、端口层面 (3)日志层面 (4)接口层面 (5)用户层面 三、创业型公司如何快速实现立体化监控 【如可快速实现机器、操作系统级别的监控?】...两类实现思路:分发型监控 + 汇总型监控 分发型监控 ?...引入第三方监控 四、总结 创业型公司快速实施立体化多维度监控总结: (1)机器、操作系统维度监控:zabbix (2)进程、端口维度监控:分发型监控 + 汇总型监控 (3)错误日志与关键字维度监控 (4

92070

SGADC2019 | 京东移动网络优化及立体化监控体系(深度长文)

同时本文也详细讲解了在国家推行IPv6的情况下获得IPv6/IPv4双栈网络下的经验和踩坑经历,以及如何构建立体化的异常监控、性能监控体系来提升移动互联网络优化,带来更好的用户体验和业务可用性。...总体而言,优化思路是集中在速度、安全、稳定性、监控4个方面,结合完善的监控系统,进行持续优化。...三 立体化监控体系 下图是立体化监控全景图,监控数据涵盖业务监控、用户端监控,基础监控、服务端监控,把数据整合到APM平台与THOR平台,建设这样一个平台,方便运维、测试、运营、QA团队去订阅数据和接收告警...,实现了全流程从前到后的立体化监控体系。...移动网络优化、监控告警是一个技术活,如何提升移动网络优化?如何构建立体化监控体系?开发者都需要去做一些特定的优化,来达到优化移动网络的目的。 End

2.9K40

怎样的监控,才真正说明系统有问题?

监控不告警,系统就一定没有问题么?怎样的监控,才真正说明系统有问题?今天和大伙聊聊多维度立体化监控。 什么是多维度立体化监控?...接口监控; (8)用户层面监控; 如果只监控一个或少数几个维度: (1)监控到异常时,基本确信系统出现了问题; (2)反过来,没有监控到异常,不能确信系统没有问题; 例如: (1)监控到操作系统CPU100%...,并不能说明系统正常,例如数据库挂了,数据库连接拿不到,服务层每个接口都很快返回,并不超时; 这里的观点是:单维度监控易漏报,多维度立体化监控才是监控平台的根本之道。...监控方案:nginx日志统一监控 如果实现了http接口统一监控,404监控的必要性并不是这么强,但毕竟实现简单,整一个通用的花不了多少时间。...总结 监控是一个技术活: (1)监控平台的思路是多维度立体化监控; (2)“统一操作系统、http404,服务存活性,接口处理时间”等四大类统一监控的设计核心是“非侵入性”,不需要任何人配合修改,就能实现诸多功能的技术平台

61520

用户视角的监控,再也不用凌晨起床处理线上告警了

上一篇介绍多维度立体化监控,提到系统需要监控的八个维度: http接口监控 log关键字监控 操作系统,进程,端口 http状态码 服务存活性 接口处理时间 用户层面监控 RPC接口监控 其中1和2两项...《通用+可扩展http监控平台/框架》和《通用+可扩展log监控平台/框架》分别进行了细化说明,3到6这四项上一篇《多维度立体化监控,才是真的监控》进行了简要说明,今天和大家聊聊第7项,用户视角的监控。...一、为什么要进行用户视角的监控 什么是用户视角的监控?...如上图所示,立体化监控的八大维度,除了用户视角的监控,另外七大维度,不管是机器监控,日志监控,接口监控,都是系统内部发起的,当系统外部与系统之间出现问题的时候,例如“某个省的光纤被挖断”或者“某条网络链路出现丢包...主要有三类方法: 用户所在的地方,租机房布点监控 端(APP/browser)上布点监控 使用第三方监控平台 二、租机房布点监控 ?

1.4K60

苏宁iPhone俱乐部跟苹果抢生意:剑指双11、立体化电商

电商立体化时代苏宁将日益重要 必须要留意到一个事实是,中国手机市场已经且还在发生高速“下沉”现象,简单地说,市场下沉到三四五六线城市甚至农村,用户下沉到离互联网更远的准线上用户,伴随着着两个趋势,线下渠道...阿里巴巴CEO逍遥子(张勇)表示要把今年双11打造成“立体化”的双11,京东在双十一前夕与沃尔玛高调唱起了双簧,同样押注线下。...没有iPhone就没有智能手机,没有小米就没有互联网思维,在我看来,iPhone会员俱乐部给大家都在提的新零售、O2O电商、立体化电商带来的启示在于:将服务能力包装成标准化产品,并将其提供给刚需型用户。...不过,iPhone俱乐部的玩法值得肯定,它体现出苏宁在新零售时代双线融合的优势,给每天都高喊着要服务化、立体化、个性化的电商行业带来了一个可供参考和复制的样本。

1.3K50

青铜到王者:AIOps 平台在腾讯的升级之路

在构建立体化监控的过程中,收集数据并不是最终的目标,挖掘数据的价值才是体现运维价值所在,因此腾讯运维对业务质量保障的定义分成三纬度: 监控——覆盖率、状态反馈、指标度量。...(图 质量保障的三个纬度) 按照 CMDB 管理运维对象的思路,在质量保障场景,构建立体化监控体系需要明确各个架构层级中需要被监控的运维对象,以及该运维对象所产生的监控数据在运维监控体系的作用。...一体化智能运维(AIOps)平台的立体化监控体系,实现统一监控告警平台,提供各层级监控能力。...(图 立体化监控体系) 智能运维的场景探索与实践 在构建了质量与效率的运维体系后,腾讯运维开始探索 AI 技术在运维领域的应用。...但在实施 AIOps 时,我们遇到了一个难题,由于立体化监控体系中,各监控系统的建设周期不同,各业务、各监控对象的数据格式不一,造成不同的运维的监控数据独立存在于各个监控系统中,造成严重的数据孤岛。

67360

青铜到王者:AIOps 平台在腾讯的升级之路

在构建立体化监控的过程中,收集数据并不是最终的目标,挖掘数据的价值才是体现运维价值所在,因此腾讯运维对业务质量保障的定义分成三纬度: 监控——覆盖率、状态反馈、指标度量。...(图 质量保障的三个纬度) 按照CMDB管理运维对象的思路,在质量保障场景,构建立体化监控体系需要明确各个架构层级中需要被监控的运维对象,以及该运维对象所产生的监控数据在运维监控体系的作用。...一体化智能运维(AIOps)平台的立体化监控体系,实现统一监控告警平台,提供各层级监控能力。...(图 立体化监控体系) 智能运维的场景探索与实践 在构建了质量与效率的运维体系后,腾讯运维开始探索AI技术在运维领域的应用。...但在实施AIOps时,我们遇到了一个难题,由于立体化监控体系中,各监控系统的建设周期不同,各业务、各监控对象的数据格式不一,造成不同的运维的监控数据独立存在于各个监控系统中,造成严重的数据孤岛。

5.9K110

案例分享|苏宁如何建设智能监控报警中心?

一、 苏宁立体化监控体系 01- 背景介绍 我今天分享的主题是苏宁智能监控报警中心,主要包括4个部分,苏宁立体化监控体系,Zabbix大规模监控实践,监控告警自动化,智能报警中心建设。...因此基于上述背景,我们提出构建立体化监控和智能报警中心,所谓立体化监控,首先它是一个体系,不是监控工具,也不是几个监控工具,也不是几个监控系统,它是一个完整的全面的一个体系化的监控。...其次在立体化监控里面的话,它是有点、线、面的一个有机结合的监控。第五个是在立体化监控里面是要能够做到交叉监控,智能报警中心就是管理和治理智能化和可视化。...这是苏宁当前的一个立体化监控体系的概览,从这张图的最下面能够看到,其实就是监控范围,苏宁的整个业务体系都是要在整个监控体系覆盖之下的。那么在这张图的最上面,也是立体化监控体系的四大组成部分。...,还有一些实时日志的监控,包括波测、端测、组件、业务等等,这也是刚才讲到的立体化监控里面的一部分。

82820

【前端监控】页面错误监控

一个多级不判空取值就很可能导致严重的白屏bug 你以为这种错误很少吗,就我们团队就这种bug就出现好多次,被大佬骂惨了,看看我们现在线上监控到的错误 一大半都是 of undefined,of null...PAGE_ERROR/index.js:87:1" 可以看到所有的函数调用栈,getuserInfo 和 JSError 上报什么数据 除了我们常规的上报基础数据 如你上面看到的数据,都需要上报上去 可以看一下我们监控系统最终上报的数据...,具体可以看 【前端监控】静态资源测速&错误上报 这里再简单描述下 前面我们用window.onerror 来监听js执行错误,但是它并不能获取到资源加载失败的错误,因为这些错误不会向上冒泡,但是我们可以进行捕获...所以我们这里只监听资源错误就好了 window.document.addEventListener('error',handler, true) 请求报错 请求报错的内容,也已经写过,具体可以参考 【前端监控...最后可以看下我们对于线上页面监控的一个异常数据对比图,大概长这样(数据是假的) 可以很清楚看到线上页面的稳定性,一个字,稳 最后 鉴于本人能力有限,难免会有疏漏错误的地方,请大家多多包涵, 如果有任何描述不当的地方

2K10

NTP校时服务器(北斗授时)在平安城市系统应用

平安城市利用平安城市综合管理信息公共服务平台,包括城市内视频监控系统、数字化城市管理系统、道路交通等多个系统,利用市区级数据交换平台实现资源共享。...系统前端数据通过视频监控系统采集并传输到市、区监督指挥调度中心。...三、方案简介 (1)合理布点,构建立体化防控体系 科学布点,通过地面与高清点位结合、固定与移动点位结合、治安监控与移动点位结合、视频监控与车辆管控结合、形成一套城市立体化防控体系,实现对城市人、车、物体...(3)运用智能化技术,提升应用效率 运用行为分析技术对实时视频进行智能分析,支持人员聚集、跨区域跨线、快速移动、区域入侵、人员徘徊、物品遗留等多种行为检测,化被动监控为主动防范。...基于人脸识别技术,在关键出入口部署人员卡口系统,对进出人员进行人脸抓拍比对,提供人脸注册、人员布控、人脸导入、黑名单报警、人脸检索等智能化应用,提高监控效率。

1.2K20

运维思考 | 你知道CMDB与监控是什么关系吗?

这种情况下,需要通过多种监控系统,不同的途径来感知业务系统活没活,活的好不好,用户体验怎样。常见的监控系统类型就包括:基础环境监控、网络监控、系统监控、数据库监控、应用监控、用户体验监控等等。...在这种场景下,我们在之前的文章《如何改善监控问题,试试打造企业统一监控平台体系!》一文中探讨过,就需要一个统一的监控中台来对下管理多个告警源,中间进行告警数据的处理,对上提供可消费的监控数据。...这里就会存在一个问题,监控和企业的CMDB之间是怎样的关系呢? CMDB与监控 我们的理解有如下两层关系: CMDB需要为监控系统提供必要的支撑数据,来收敛、立体化、标准化告警信息。...这个时候就需要CMDB能够主动将新的对象信息推送给监控系统,监控系统按照既有监控模板,下发agent、配置监控协议、启动监控等。...这样,我们的每一条告警在发出的时候,都可以依据CMDB中的信息,变成标准化、立体化的告警,而不是扁平的告警。这样的告警才能真正凸显价值。 作者:赵海兵

1.4K50

夜莺监控之Categraf监控VMwareVSphere

但是有了虚拟化,怎么监控性能与告警呢?当前的监控产品样式繁多,到底选择谁好呢?...那这里就不得不提当前开源易用性好、扩展能力强、采集插件多、告警通道广的监控系统:Nightingale(后面简称夜莺监控),这里并不是说其他的监控不好用,众家各有所长,这里只对夜莺做监控做讲解,不喜勿喷哈...(开源监控引领者,故障定位真帮手), 言归正传:今天讲解一下如何使用Categraf采集监控VSphere的指标数据,上报给夜莺监控V6,并在夜莺监控V6上配置VSphere监控仪表盘以及告警; 今天针对...inputs.vsphere采集vcenter指标数据,上报夜莺监控; 夜莺监控WEB页面配置:在WEB页面配置监控数据源并导入VSphere大盘、配置告警; 在夜莺监控的仪表盘配置数据源、使用导入功能...后续针对夜莺监控v6的告警自愈这块出一个抛砖引玉的文章~ 更多的夜莺监控动态信息,请关注官方网站

1.2K40
领券