共计 2469 个字符,预计需要花费 7 分钟才能阅读完成。
HPUX 上安装 NRPE,特别是在监控 Oracle 数据库有一些疑难的点,自己一边摸索一边整理了出来,就当是做个备忘
一、下载预编译好的 depot 源码包
包名:NRPE-2.12.depot.gz
免费下载地址在 http://linux.linuxidc.com/
用户名与密码都是www.linuxidc.com
具体下载目录在 /2014 年资料 / 3 月 /30 日 /HPUX 安装 Nagios 监控插件(NRPE)难点解析
下载方法见 http://www.linuxidc.com/Linux/2013-07/87684.htm
——————————— 分割线 ———————————
可能还需要另外两个包的支持,如果操作系统没有安装,也请下载:
openssl-1.0.1f-ia64-11.31.depot.gz
tcp_wrappers-7.6-ia64-11.31.depot.gz
——————————— 分割线 ———————————
二、创建 NRPE 用户
groupadd -g 312 nrpe
useradd -g nrpe -G oinstall -u 312 nrpe(注:之所以添加到 oinstall 组,是使其具备执行 oracle 插件的权限)
三、HPUX 上安装 NRPE
swinstall -s /tmp/NRPE-2.12.depot.gz
swlist -l product | grep NRPE
四、将 NRPE 配置为 inetd 管理进程
/opt/nrpe/bin/configure.sh
会在 /etc/services 与 /etc/inetd.conf 文件中添加 nrpe 相关的配置项
五、修改 NRPE 主配置文件
vi /opt/nrpe/etc/nrpe.conf
主要修改两个地方:
1、allowed_hosts=127.0.0.1,nagios_server_ip
2、command[check_users]=/opt/nrpe/libexec/check_users -w 5 -c 10(添加监控命令)
六、启动 NRPE
inetd -k && inetd(作为 inetd 后台服务启动)
七、测试 NRPE
/usr/local/nagios/libexec/check_nrpe -H xxxxxx
NRPE v2.12
返回上信息测试成功,在服务端同样测试
netstat -na | grep 5666
查看 nrpe 服务端口
安装过程中常见疑难解答:
其实 nrpe 安装很简单,但针对 ORACLE 数据库的检查(check_oracle),有可能会出现一些问题,这里整理了下:
1、nagios 服务端 check_nrpe -H nagios_client_IP 时提示 ssl 连接错误?
可能原因:
a、检查 nagios_client 的 nrpe.cfg 配置文件,allowed_hosts 有没有正确添加服务端的 IP;
b、检查 openssl 包有没有装上;
c、检查服务器之间的防火墙有没有放通 5666 端口;
2、在 hpux 服务器上测试 check_oracle –cache orcl username password 总是提示用户名密码错误,无论用什么帐户都报这个错误?
可能原因:
a、一定要注意 hpux 上输入 oracle 相关用户名密码进分别用单引号引起来,如 ’username’ ‘password’
3、在 hpux 服务器上测试 check_oracle –login check_oracle –cache 都可以正常返回数据,但在 nagios 服务端总是没
有数据返回,但 nrpe 通信又是正常的,users,disk,load 等都可以正常返回数据?
可能原因:
a、遇到这个问题,最好的测试方法是在 nrpe.cfg 的中相关监控项目后加上 >> /tmp/output 2>&1 将输出结果输入一个
文件,方便查看;
b、一些库文件找不到,如 utils,这个文件在 /opt/nrpe/libexec 目录下有,但系统会自动到 / 目录下查找,只要做个软连接就可以了
ln -s /opt/nrpe/libexec/utils.sh /utils.sh
c、提示 ps,grep,awk 等命名找不到,这当然是环境变量中没有添加相应命名的路径,把 /usr/bin 这个目录加到 PATH
d、提示 su:sorry,主要是执行 sqlplus 操作需要具有 oracle 用户的相关权限,只需要将 nrpe 用户添加 到 oinstall 组
usermod -G oinstall nrpe
4、执行 check_oracle 这个脚本就报错,如找不到服务名,没有权限等等
可能原因:
a、由于我们是在 nrpe 这个用户下执行 check_oracle,所以一定要注意环境变量问题,把 $ORACLE_HOME 加到这个脚本中去
Nagios 的详细介绍:请点这里
Nagios 的下载地址:请点这里
相关阅读:
网络监控器 Nagios 全攻略 http://www.linuxidc.com/Linux/2013-07/87067.htm
Nagios 搭建与配置详解 http://www.linuxidc.com/Linux/2013-05/84848.htm
Nginx 环境下构建 Nagios 监控平台 http://www.linuxidc.com/Linux/2011-07/38112.htm
在 RHEL5.3 上配置基本的 Nagios 系统(使用 Nagios-3.1.2) http://www.linuxidc.com/Linux/2011-07/38129.htm
CentOS 5.5+Nginx+Nagios 监控端和被控端安装配置指南 http://www.linuxidc.com/Linux/2011-09/44018.htm
Ubuntu 13.10 Server 安装 Nagios Core 网络监控运用 http://www.linuxidc.com/Linux/2013-11/93047.htm