接下来通过NRPE插件来监控本机状态,首先检测一下nrpe是否正常运行 执行以下命令
下载方法见 http://www.linuxidc.com/Linux/2013-07/87684.htm
一、nagios简介 nagios是一款用于系统和网络监控的应用程序,它可以在你的设定的条件下对主机和服务进行监控,在状态变差和变好的时候可以给管理员出告警信息。 nagios所需要的运行条件是机器必须可以运行linux(或是unix变种)并且有c语言编译器。你必须正确地配置tcp/ip协议栈以使大多数的服务检测可以通过网络得以进行。如果需要正确地配置nagios里的cgis程序,必须安装以下这些软件: web服务(最好是apache) thomas boutell制作的gd库版本应是1.6.3或更高(在cgis程序模块statusmap和trends这两个模块里需要这个库) 还有一个就是ssl这一个工具,在安装nrpe这一个包时需要,因为在监控其他主机的时候是通过ssl连接来接收数据的; 网络环境: 主机 IP OS 角色 nagios 192.168.0.10 rhel5.1 监控服务器 win2003 192.168.0.100 windows server 2003 被监控主机 linux 192.168.0.102 rhel5.1 被监控主机 准备软件: apache2.2.14 //下载地址http://httpd.apache.org/download.cgi nagios3.2.0 nagios plugins1.4.14 nrpe2.12 上面三个都可以在这个网站上找到http://www.nagios.org/download nsclient++-0.3.6-win32.msi //如果要监控windows的主机,还要下载nsclient这一个客户端工具,下载地址: http://sourceforge.net/projects/nscplus/ 确认邮件是否能正常发送,我用的是sendmail,确认服务已经启动,下面发一封测试邮件到指定邮箱: #mail –s “this is test mail” kyhack@vimp.qq.com this is nagios test mail ok 按ctrl + d 结束输入。 检查一下自己的邮箱,看到邮件之后就可以继续以下的环节了。 把所有的工具都下载到src目录下面: wget http://prdownloads.sourceforge.net/sourceforge/nagios/nagios-3.2.0.tar.gz wget http://prdownloads.sourceforge.net/sourceforge/nagiosplug/nagios-plugins-1.4.14.tar.gz wget http://prdownloads.sourceforge.net/sourceforge/nagios/nrpe-2.12.tar.gz wget http://apache.etoak.com/httpd/httpd-2.2.14.tar.gz 二、开始安装 1、安装apache tar xvf httpd-2.2.14.tar.gz -C /usr/src cd /usr/src/httpd-2.2.14 ./configure --prefix=/usr/local/apache2 make make install /usr/local/apache/bin/apachectl start //由于是没有改动的配置文件,可以直接启动 netstat –an |grep 80 //检查80端口是否已经开启了 或者是在别的机子上输入服务器的ip地址,当看到“it works!”时表明apache已经安装成功了 2、安装nagios 先添加一个nagios的账号 useradd nagios –s /sbin/nologin //有的文章说要启用账号,其实不用也可以,因为这个账号不需要登录 tar xvf nagios-3.2.0.tar.gz -C /usr/src cd /usr/src/nagios-3.2.0 ./condfigure —prefix=/usr/local/nagios —with-nagios-us
Nagios是一款用于监控系统和网络的开源应用软件,它的模式是服务器—客户端,也就是说首先要在在一台服务器上(server)部署相应的主要套件,然后在要监控的服务器上部署客户端程序,这样server会和client通信,从而监控client端的各项资源。Nagios功能十分强大几乎所有的项目都可以监控,大到服务器的存活状态,小到服务器上的某一个服务(web)。这些功能都是通过自定义插件(或者叫做脚本)来实现。
在大多数情况下Cacti + RRDtool已经实现对系统各种参数的监测。但很多企业可能不满足于仅仅监测系统基本参数的需求,而是需要监测除基本参数之外的各种应用程序的运行状况。很显然在这种情况下对于一些系统或者是自定义的程序Cacti + RRDtool的局限性就显示出来了。而此时就轮到了另外一种监测系统的登场。这就是我们现在要介绍的Nagios。 Nagios是一个功能非常强大的开源的系统网络监测程序,通过访问http://www.nagios.org可以了解其基本特性。Nagios不但能够实现对系统CP
前面已经对远程Linux 主机是否存活做了监控,而判断远程机器是否存活,我们可以使用ping 工具对其监测。还有一些远程主机服务,例如ftp、ssh、http,都是对外开放的服务,即使不用Nagios,我们也可以试的出来,随便找一台机器看能不能访问这些服务就行了。但是对于像磁盘容量,cpu负载这样的“本地信息”,Nagios只能监测自己所在的主机,而对其他的机器则显得有点无能为力。毕竟没得到被控主机的适当权限是不可能得到这些信息的。为了解决这个问题,Nagios为我们提供了多种解决方案。
Nagios监控linux服务器 一、客户端 安装所需的软件(nagios-plugins、nrpe) #wget http://prdownloads.sourceforge.net/sourceforge/nagiosplug/nagios-plugins-1.4.16.tar.gz #wget http://prdownloads.sourceforge.net/sourceforge/nagios/nrpe-2.13.tar.gz 1、安装nagios-plugins #增加一个用户 useradd nagios -s /sbin/nologin -M 解压并安装 #tar zvxf nagios-plugins-1.4.16.tar.gz && cd nagios-plugins-1.4.16 #./configure --with-nagios-user=nagios --with-nagios-group=nagios && make && make install #chown -R nagios:nagios /usr/local/nagios 2、安装nrpe #tar -zxvf nrpe-2.13.tar.gz && cd nrpe-2.13 #./configure --enable-ssl --with-ssl-lib (前提是已经安装了openssl与openssl-devel) #make all && make install-plugin && make install-daemon && make install-daemon-config 3、配置nrpe 配置nrpe信息 #vim /usr/local/nagios/etc/nrpe.cfg,查找并修改如下一行 allowed_hosts=172.16.17.223,127.0.0.1 #注意修改为nagios服务器的IP:172.16.17.223 #配置监控对象 说明:由监控原理可知被监控端做监控,然后将数据传给监控服务器绘总,设置监控详细参数主要是设置被监控端的nrpe.cfg文件,可以看到里面监控对象 vim /usr/local/nagios/etc/nrpe.cfg,查找并修改如下一行 command[check_users]=/usr/local/nagios/libexec/check_users -w 5 -c 10 command[check_load]=/usr/local/nagios/libexec/check_load -w 15,10,5 -c 30,25,20 command[check_disk]=/usr/local/nagios/libexec/check_disk -w 10% -c 5% command[check_zombie_procs]=/usr/local/nagios/libexec/check_procs -w 5 -c 10 -s Z command[check_total_procs]=/usr/local/nagios/libexec/check_procs -w 500 -c 550 command[check_swap]=/usr/local/nagios/libexec/check_swap -w 20% -c 10% command[check_ping]=/usr/local/nagios/libexec/check_ping -H 192.168.1.1 -w 100.0,20% -c 500.0,60% 后两行是自添加的 4、启动nrpe,并测试 #/usr/local/nagios/bin/nrpe -c /usr/local/nagios/etc/nrpe.cfg -d #echo “/usr/local/nagios/bin/nrpe -c /usr/local/nagios/etc/nrpe.cfg -d &> /dev/null” >> /etc/rc.local #netstat -atulnp | grep nrpe tcp 0 0 0.0.0.0:5666 0.0.0.0:* LISTEN 5201/nrpe #/usr/local/nagios/libexec/check_nrpe -H localhost NRPE v2.13 二、服务器端 1、安装所需的软件(nagios、nagios-plugins、nrpe)下载后源码包安装,不赘述 wget http://prdownloads.sourceforge.net/sourceforge/nagios/nagios-3.4.1.tar.gz w
Nagios是一款开源的免费网络监视工具,能有效监控Windows、Linux和Unix的主机状态,交换机路由器等网络设置,打印机等。在系统或服务状态异常时发出邮件或短信报警第一时间通知网站运维人员,在状态恢复后发出正常的邮件或短信通知。 Nagios和cacti有什么区别呢?简单的来说cacti主要监控流量,服务器状态页面展示;nagios主要监控服务,邮件及短信报警灯,当然也有简单的流量监控界面,二者综合使用效果更好。(附Nagios工作简单逻辑图) Nagios监控客户端需要借助插件及NRPE软件来实
上一篇文章介绍了 Nagios服务器的安装,本文继续介绍如何添加被监控的服务器,内容比较枯燥,都是安装过程,但希望能对准备使用Nagios的小伙伴有点帮助 远程监控原理 Nagios 与远程主机的
本文介绍了Nagios系统的基本概念、部署方法、监控指标、插件、报警机制、配置方法、优化实践以及Nagios系统在技术社区中的应用。
NRPE是Nagios的一个功能扩展,它可在远程Linux/Unix主机上执行插件程序。通过在远程服务器上安装NRPE插件及Nagios插件程序来向Nagios监控平台提供该服务器的本地情况,如CPU负载,内存使用,磁盘使用等。这里将Nagios监控端称为Nagios服务器端,而将远程被监控的主机称为Nagios客户端。
HPUX上安装NRPE,特别是在监控Oracle数据库有一些疑难的点,自己一边摸索一边整理了出来,就当是做个备忘
第一节 Nagios简介 nagios是系统管理人员和运维监控人员必须的工具之一,利用nagios可以监控本地或者远程主机资源, 如磁盘空间,系统负载等情况,也可以监控各种应用,例如HTTP服务,FTP服务等。当主机或服务出现故障 Nagios可以通过邮件手机飞信等形式在第一时间通知系统维护人员。 同时,Nagios可以提供一个可选的基于浏览器的Web界面,以方便系统管理员查看系统的运行状态、网络状态 各种系统问题以及日志异常。! 第二节 Nagios结构与特点 从结构上讲,Nagios可分为核
本文安装Nagios只使用Nagios邮件报警功能,如需画图另外安装cacti,或其他插件。
Linux下有2大监控神器cacti+nagios,下面我把我自己搭建nagios的步骤记录下来,以便以后需要的时候看。
vim /usr/local/nagios/etc/objects/contacts.cfg
中文插件:http://sourceforge.net/projects/nagios-cn/files/
在本教程中,我们将介绍在Ubuntu 14.04上安装非常流行的开源监控系统Nagios 4。我们将介绍一些基本配置,以便您可以通过Web界面监控主机资源。我们还将利用将作为代理安装在远程主机上的Nagios Remote Plugin Executor(NRPE)来监控其本地资源。
写在前头:限于个人对nagios的了解有限,写得不够深入与系统,甚至可能会有些错误,各位看官还多包涵。本文主要涉及的是nagios daemon、nrpe及三个部分。 01 nagios系统的功能 主机或服务状态监控 nagios是一款开源的监控软件,从它可以监控的设备类型上来看,主要包含网络设备,服务器设备。常见的网络设备如:路由器、交换机、防火墙、F5、打印机等,常见的服务器设备主要分为:UNIX类、Linux类以及Windows类。按我的理解凡是支持snmp协议的设备,包含PC都可以通过nag
在本教程中,我们将介绍在CentOS 7或RHEL 7上安装Nagios 4(一种非常流行的开源监控系统)。我们将介绍一些基本配置,以便您可以通过Web界面监控主机资源。我们还将利用将作为代理安装在远程主机上的Nagios Remote Plugin Executor(NRPE)来监控其本地资源。
通常我们会在项目所在的机房部署一套监控系统来监控我们服务器和MySQL之类的公共服务,制定报警策略,在出现异常情况的时候邮件或短信提醒我们及时处理。
Nagios是一个流行的电脑系统和网络监控程序,它检测主机和服务,当异常发生和解除时能提醒用户。它是基于GPLv2开发的开源软件,可免费获得及使用。 使用Nagios这样的监控系统是生产环境的必备工具,通过监控系统运行时间,CPU使用率或磁盘空间,您可以在问题发生之前解决用户问题。
上一篇介绍了如何安装Nagios Core(见 http://www.linuxidc.com/Linux/2014-09/107409.htm),这一篇跟大家分享一下如何将一台远程的Linux服务器加入纳入监控范围。
上线的服务器有时会被人攻击,导致服务不可用,今天安装配置了nagios对上线服务器进行监控,简单记录一下 #安装必要的软件包 yum install -y gcc glibc glibc-common gd gd-devel xinetd openssl-devel #创建nagios用户及授予目录权限 useradd -s /sbin/nologin nagios mkdir /usr/local/nagios chown -R nagios.nagios /usr/local/nagios #安装nag
Nagios是一款开源免费的网路监视工具,可以监控的设备:Windows,Linux,Unix,Router,Switch,打印机等,具有报警功能,是一个网络监控系统。在系统或服务状态异常时发出邮件或短信报警第一时间通知网站运维人员,在状态恢复后发出正常的邮件或短信通知。
本文介绍了如何使用Nagios对Hadoop YARN集群进行监控。首先介绍了Nagios的基本概念和架构,然后详细描述了如何使用Nagios对Hadoop YARN集群进行监控。主要包括配置Nagios、定义监控命令和服务、定义服务状态和故障、以及如何使用Nagios进行故障排查。最后,列举了一些常见的问题和注意事项。
1.nagios安装 ------------ 2.添加用户和密码 htpasswd /usr/local/nagios/etc/htpasswd.users eddy
#/usr/local/nagios/bin/nrpe -c/usr/local/nagios/etc/nrpe.cfg –d
Nagios的功能是监控服务和主机,但其自身并不包括这部分功能,所有的监控、检测功能都是通过各种插件来完成。启动Nagios后,它会周期性的调用插件去检测服务器状态,同时Nagios会维持一个队列,所有插件返回来的状态信息都进入队列,Nagios每次都从队首读取信息,进行处理后,再把状态通过web展现出来。
在 http://exchange.nagios.org/ 上有shell 写的脚本,nagios可以监控到命中率,他是基于 telnet 的,使用之后看到 进程里有个telnet 进程,很不爽,而且脚本休要修改一下,不然会报错,不知道大家是不是同样的问题,而我,想要的是监控命中率,还有内存使用率以及,当前连接数·所以只能自己动手来写个脚本了·在python的官网上看到有 python-memcache包,就下来看了一下源码,使用还是很方便的·。
yum install gcc yum install glibc glibc-common yum install gd gd-devel
服务器资源使用情况及硬件监控,是服务器管理员或运维人员必备的技能和工作内容。对于服务器硬件的时时监控,除了需要掌握定的方法外,还常会用到些相应的相关软件程序。
首先来了解下几个命令,这几个命令在heartbeat安装后会自动加上,我们的监控脚本就用到这几个命令。
好多重要的服务器都使用了RAID阵列来提高气硬件的冗余,保护数据的绝对安全,尤其是数据库使用的更加广泛。然而有的时候磁盘阵列组中的某些磁盘可能由于某些原因导致掉线,会使系统出现异常,所以对其进行监控是很必要的,文章就是介绍如何进行监控
一、实验环境 二、实验步骤 1、搭建nagios监控系统 1)关闭防火墙 2)创建nagios用户和用户组 3)编译安装nagios(需要提前配置yum) 安装支持包: 配置: 编译和安装: 注意:安
Alerta是一个Web应用程序,用于合并和删除来自多个监视系统的警报,并在单个屏幕上显示它们。Alerta可以与许多被人们广泛熟知的监控工具集成,如Nagios,Zabbix,Sensu,InfluxData Kapacitor等等。
Note: There is a file embedded within this post, please visit this post to download the file. 机房没有温度报警装置,我用此方法实现对机房温度的掌控,如果只有一台报警,则可认为单机故障,如果几台同时报警,则可认为机房空调出现了问题。
-- ulimit -n 65535 -- 监控nagios客户端强行安装 1,安装 [root@localhost nagios]# ll 总计 768 -rw-r--r-- 1 root root 713389 12-16 12:08 nagios-plugins-1.4.11-1.x86_64.rpm -rw-r--r-- 1 root root 32706 12-16 12:09 nrpe-2.12-1.x86_64.rpm -rw-r--r-- 1 root root 18997 12-16 12:08 nrpe-plugin-2.12-1.x86_64.rpm
分享了如何监控Linux服务器,我们来看看使用Nagios如何监控Windows服务器。
安装mysql之后,需要对mysql服务进行监控。 nagios开源自带的check_mysql 对 mysql 的slave 机监控倒是不错。但是对数据库主机监控就略显不足了。 使用一个监控插件:check_mysql_health 下载和使用方法见: http://exchange.nagios.org/directory/MySQL/check_mysql_health/details 具体监控: 对于slave 机 ,使用nagios 自带的 check_mysql 监控 command[check
Nagios是一个流行的电脑系统和网络监控程序,它检测主机和服务,当异常发生和解除时能提醒用户。它是基于GPLv2开发的开源软件,可免费获得及使用。
check_command:在commands.cfg文件中定义或在nrpe.cfg里面定义的命令;
allNicName=`ifconfig | grep HWaddr| awk '{print $1}'`;
大致意思就是打开了debug模式,会将日志存放到deamon.debug中, 然后只要在syslog.conf中将deamon.debug显示就行了。
前言:出于想监控ubuntu server 8.04下的Mysql是否在正常运行,于是找到了Nagios,Cacti及cactiez,cacti的绘图能力很强,nagios3报警能力强;经过简单试用,我觉的cacti的配置没有Nagios配置简单,所以就先试下nagios。用的版本是3.2.0
Nagios是一款开源免费(也有收费版的Nagios XI)的监控工具,可以用以监控Windows、Linux、Unix、Router、Switch,可以监控指定主机的物理基础资源或服务,当被监控对象健康状态“变好”或者“变坏”的时候,可以通过邮件、短信等方式通知到相关管理人员或运维人员。
nagios 3.X pnp-0.4.3 配置小记 作者:刘宇 liuyu.blog.51cto.com 配置环境:cetnos5 apache2 nagios3 pnp-0.4.3 安装过程 引用石头兄的话: 1. compile php with zlib and gd option; 2. configure and make install the pnp; 3. modify the nagios.cfg and command.cfg with the process_perfdata and host/service_data option; 4. rename PNP‘s templates.dist as templates; 此步骤不是必须的(不过改了也没问题) 5. rename all PNP’s cfg_sample files _sample suffix; 6.Action_url: action_url,在2.x中,只能通过serviceextinfo来做。在3.x中,可以通过模板来继承,因此在3.x中,配置量会减少很多(特别是太规模部署时) 本文不详细介绍安装过程:看官方文档 [url]http://www.pnp4nagios.org/pnp/install[/url] 如果你是用的centos5 像zlib gb rrdtool 可以直接使用yum 方法来源:linuxtone.org [netseek兄弟]
ESXi可以在相关面板上看见smart信息, 我这边公司用的是组装的服务器,然后不支持,只好用SSH的办法去获取了。 Nagios监控是按退出的状态代码来显示相关信息的。 退出代码如下: 0 ok; 1 warning; 2 critical; 3 unknown python可以用 paramiko 去实现SSH连接并执行命令这一过程。 paramiko 下载位置 pypi.python.org/pypi/paramiko
我建议您遵循以下流程: 连续监视可以及时发现问题或弱点,并采取快速纠正措施来帮助减少组织的费用。持续监控提供的解决方案可解决以下三个运营准则:
先将当前的nagios2.9备份 cd /usr/local cp -r nagios nagios2.9 cd /etc/init.d/ cp nagios nagios2.9 升级(从2.9到3.0.3) 下载nagios-3.0.3 首先大致的看一下里面的两篇文章 whatsnew.html和upgrading.html 介绍了新版的特点和升级方法 然后开始升级工作 解压缩后执行 ./configure --with-command-group=nagios make all make install 然后验证 /usr/local/nagios/bin/nagios -v /usr/local/nagios/etc/nagios.cfg 报两个warning和一个critical 两个warning是:downtime_file 和 comment_file这两个文件已经不在使用,将他们的内容添加到state_retention_file这个文件的后面 一个critical是:434行有错误,变量不能识别 解决两个warning的方法如下: 先将nagios.cfg中comments 和downtime变量注释掉 # COMMENT FILE # This is the file that Nagios will use for storing host and service # comments. #comment_file=/usr/local/nagios/var/comments.dat # DOWNTIME FILE # This is the file that Nagios will use for storing host and service # downtime data. #downtime_file=/usr/local/nagios/var/downtime.dat 查找state_retention_file=/usr/local/nagios/var/retention.dat 然后执行 cd /usr/local/nagios/var cat comments.dat >>retention.dat cat downtime.dat >>retention.dat 解决critical的方法如下 注释掉434行的#check_result_buffer_slots=4096 这个变量已经不在使用了。 然后再验证启动nagios就没问题了 需要说明:从2.x升级到3.x还有这样一点要注意 Extended host and extended service definitions have been deprecated. They are still read and processed by Nagios, but it is recommended that you move the directives found in these definitions to your host and service definitions, respectively. 我配置的有extended service,但是里面的配置信息是nagios grapher自动生产的。况且3.x是可以读的,只是推荐写到service定义中而已。我这里并没有按照这条的建议。没对原来的配置做修改。 Nagvis启动故障的排查 更新nagios之后 启动nagvis需要的NDO组件 /usr/local/nagios/bin/ndo2db -c /usr/local/nagios/etc/ndo2db.cfg 提示Could not bind socket: Address already in use 查看/usr/local/nagios/etc/ndo2db.cfg 有这样的内容 # SOCKET TYPE # This option determines what type of socket the daemon will create # an accept connections from. # Value: # unix = Unix domain socket (default) # tcp = TCP socket socket_type=unix #socket_type=tcp socket是unix类型的(是一个sock文件),而不是tcp类型的(tcp端口) 原来是/usr/local/nagios/var/ndo.sock还存在(因为ndo是使用kill命令杀掉进程的) 所以删掉这个.sock文件即可 运行/usr/local/nagios/bin/ndo2db -c /usr/local/nagios/etc/ndo2db.cfg 启
领取专属 10元无门槛券
手把手带您无忧上云