共计 1678 个字符,预计需要花费 5 分钟才能阅读完成。
好多重要的服务器都使用了 RAID 阵列来提高气硬件的冗余,保护数据的绝对安全,尤其是数据库使用的更加广泛。然而有的时候磁盘阵列组中的某些磁盘可能由于某些原因导致掉线,会使系统出现异常,所以对其进行监控是很必要的,文章就是介绍如何进行监控
其实很简单的啦:)
安装脚本:需要做一个 web 服务器作为软件下载使用,如果多台机器的话,直接执行就 OK 了
++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
wget http://192.168.1.100/Lib_Utils-1.00-08.noarch.rpm
wget http://192.168.1.100/MegaCli-8.00.40-1.i386.rpm
wget http://192.168.1.100/check_raid_info.sh
/bin/rpm -ivh MegaCli-8.00.40-1.i386.rpm Lib_Utils-1.00-08.noarch.rpm
/usr/bin/killall nrpe
/bin/cp -av check_raid_info.sh /usr/local/nagios/libexec/
echo “command[check_raid_info]=/usr/local/nagios/libexec/check_raid_info.sh” >>/usr/local/nagios/etc/nrpe.cfg
/usr/local/nagios/bin/nrpe -c /usr/local/nagios/etc/nrpe.cfg -d
/bin/chmod a+rx /usr/local/nagios/libexec/*
/bin/sed -i ‘s/require/!require/’ /etc/sudoers
/bin/echo “nagios ALL= (ALL) NOPASSWD: /opt/MegaRAID/MegaCli/MegaCli64” >>/etc/sudoers
++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
然后需要在 nagios 的服务器上添加对应的监控配置片段:
define service{
use generic-service ; Name of service template to use
host_name DB_service
service_description Raid Array Info
check_command check_nrpe!check_raid_info
check_interval 30
}
这个配置将检查间隔设置成 30 分钟检测一次
完成之后检测 nangios 配置无误,重启服务
web 界面的显示效果如下:
可以很明显看出阵列类型是 RAID10 4 块磁盘 容量和状态
推荐阅读:
Debian 软 RAID 安装笔记 – 使用 mdadm 安装 RAID1 http://www.linuxidc.com/Linux/2013-06/86487.htm
常用 RAID 技术介绍以及示例演示(多图) http://www.linuxidc.com/Linux/2013-03/81481.htm
Linux 实现最常用的磁盘阵列 – RAID5 http://www.linuxidc.com/Linux/2013-01/77880.htm
RAID0+ 1 和 RAID5 的性能测试结果 http://www.linuxidc.com/Linux/2012-07/65567.htm
RHEL 下安装配置 Nagios 与 Cacti 服务 http://www.linuxidc.com/Linux/2013-01/77363.htm
Nagios 的详细介绍:请点这里
Nagios 的下载地址:请点这里