浅谈Orabbix监控指标(r6笔记第27天)

对于Orabbix监控Oracle来说,它是提供了一个相对轻量级的客户端来综合监控多个数据库实例。从这一点来看,它的角色有点类似于工作中使用的SQLDeveloper或者toad这类的工具。 在之前的章节中,先花了些篇幅去比较zabbix和grid control,其实从功能上来看,基于zabbix的Orabbix的监控功能要有限的多。提供的默认模板中,监控触发器不到20个。 自己梳理了一下,默认的监控触发器在15个左右。

故障类型

报警对应项

错误类型

报错简述

数据库没有数据响应

Oracle:alive

High

数据库无数据响应

数据库实例不可用

Oracle:alive

High

数据库实例是否可用

数据库中存在锁

Oracle:locks

High

数据库中存在锁

session使用量过高

(Oracle:session.last(0)}*100/Oracle:maxsession.last(0)})>80

High

session过多,比如session超过80%

Process 使用量过高

(Oracle:procnum.last(0)}*100/Oracle:maxprocs.last(0)})>80

High

process过多,比如process超过80%

异常信息的通用审计

Oracle:audit

High

异常信息的审计,比如密码错误次数过多

active session数过高

Oracle:session_active

High

active session数

用户异常锁定

Oracle:users_locked

Warning

用户密码过期或者错误登录次数过多账户锁定

表空间使用率过高

Oracle:showtsps

Warning

表空间使用率超过90%

归档日志量过高

Oracle:archive

Warning

归档日志量

正常运行时间

Oracle:uptime

Average

正常运行情况

PGA 使用量过高

(Oracle:pga.last(0)}*100/Oracle:pga_aggregate_target.last(0)})>90

Average

PGA使用率过高

缓存命中率不足

Oracle:hitratio_table_proc.avg(60)}<50|Oracle:hitratio_trigger.avg(60)}<50|Oracle:hitratio_sqlarea.avg(60)}<50|Oracle:hitratio_body.avg(60)}<50

Information

缓存命中率不足

在这个基础上进行了一些额外的补充,比如去检测dg是否可用,检测闪回区空间利用率是否合理,监控内存使用率是否过高等等。

datagurad不可用

Oracle:dg_error

High

datagurad不可用

剩余内存不足2G

Oracle:vm.memory.size[free].last()}<2048m

Warning

剩余内存不足2G

闪回区使用率过高

Oracle:archive_area_usage

Warning

闪回区使用率过高

其实和实际工作结合起来还有不少的盲点。 比如监听器的监控 是否有有大量的并行查询 DB响应时间的监控 ASM的一些基本监控 rac实例的监控 所以把问题以面铺开来看,还有很多的工作需要做,而不只是局限于当前的监控指标。 当然了也不能这么为难orabbix,我相信这个开发者是希望在Oracle的监控上有所突破,但是还是给我们留下了不少的功课去完成。 自己在sourceforge上下载了源码,源码的实现是基于java,依赖于zabbix基础工程,代码量其实不大,如果能够在这个基础上进行深入扩展,可能还会有更多的惊喜。 比如目前使用orabbix监控表空间的使用明细,比如在数据库A中有10个表空间,在数据库B中有5个表空间,对于表空间的空间剩余量的监控通过SQL就会是下面的形式。

TS1 5%

TS2 9%

TS3 20%

TS4 30% 比如我们需要监控剩余比例在10%以内的,那就是说TS1,TS2了。目前的实现是把结果集当做一个text来对待,还不能把结果集中的每一列单独来处理,所以邮件报警的显示还是不够清晰。还得借助于结果集,然后再次进行脚本格式化显示,实现起来还是不够那么灵活。这个也是我下一步需要攻关的点。 如果我们较真一下,比较一下gc和orabbix的监控指标,gc里面有300多个,粒度,数量上远远超过了orabbix,但是如果你自己静下心来,似乎自己常用的指标其实不到10%。 还是选择适合自己的,满足工作就可以。

原文发布于微信公众号 - 杨建荣的学习笔记(jianrong-notes)

原文发表时间:2015-08-13

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏我的博客

php://input解决APP发送图片问题

今天公司要求用APP发送一个图片到PHP程序接收并保存起来,而且中间还需要很多参数! 以前没有做过APP和PHP交互,这次算是一个挑战吧(对一个没有人指导实习...

3048
来自专栏深度学习那些事儿

关于在ubuntu上源码安装TensorFLow-1.7.0-cuda9.1-cudnn7.1.2过程中问题解决方案

实验室服务器上装载的cuda版本是最新的9.1,和从官网下载下来的TensorFlow不匹配,因为官方的是通过cuda9.0进行编译的。因此,这篇文章讨论关于T...

46410
来自专栏有刻

Nginx 原理解析和配置摘要

4229
来自专栏zhangdd.com

linux服务器性能检测工具nmon使用

今天介绍一款linux系统服务器性能检测的工具-nmon及nmon_analyser (生成性能报告的免费工具),亲测可用。 一.介绍 nmon 工具可以帮...

2973
来自专栏MoeLove

[译]Tornado4.3-用户指南

Tornado 4.3于2015年11月6日发布,该版本正式支持Python3.5的async/await关键字,并且用旧版本CPython编译Tornado同...

1064
来自专栏FreeBuf

Linux内核中的递归漏洞利用

6月1号,我提交了一个linux内核中的任意递归漏洞。如果安装Ubuntu系统时选择了home目录加密的话,该漏洞即可由本地用户触发。如果想了解漏洞利用代码和短...

2926
来自专栏牛客网

知识总结:I/O模型基础I/O基础

I/O基础 1、java1.4之前,java对I/O支持不完善,存在以下问题: 没有数据缓冲区,I/O性能存在问题。 没有C或者C++的channel概念,只...

3779
来自专栏Python小屋

Python使用标准库urllib模拟浏览器爬取网页内容

爬取网页内容的第一步是分析目标网站源代码结构,确定自己要爬取的内容在哪里,这要求对HTML代码有一定了解,对于某些网站内容的爬取还需要具有一定的Javascri...

1001
来自专栏云计算教程系列

如何在Ubuntu 14.04上设置R.

R是一种流行的开源编程语言,专门用于统计计算和图形。它被统计学家广泛用于开发统计软件和执行数据分析。R的优势之一是允许用户创作和提交自己的包,因此它具有高度且易...

882
来自专栏一个爱瞎折腾的程序猿

express使用记录

2071

扫码关注云+社区

领取腾讯云代金券