Nagios是常用的流行开源监控系统,可以监控IT基础设施、服务和应用程序。要设置Nagios监控CPU使用情况,需要配置Nagios相应告警和阈值。
先安装Nagios核心和NRPE,确保Nagios服务器和要监控的目标服务器都安装了Nagios和NRPE,NRPE可以运行Nagios服务器远程执行插件检查目标服务器的状态。
在目标服务器上编辑NRPE的配置文件,一般是在 /etc/nagios/nrpe.cfg 或 /etc/nrpe.cfg),添加一个新的命令来监控 CPU 使用率。
command[check_cpu]=/usr/lib/nagios/plugins/check_cpu w 80 c 90
w 和 c 参数分别代表警告和临界阈值。如,w 80 表示当 CPU 使用率超过 80% 时发出警告,c 90 表示当 CPU 使用率超过 90% 时发出临界警告。
保存配置文件后,重启 NRPE 服务以应用更改。
sudo systemctl restart nrpe
或者在某些系统上可能是:
sudo service nrpe restart
在 Nagios 服务器上,要为要监控的目标服务器添加一个主机定义,并为该主机添加一个服务定义,用于监控 CPU 使用率。
打开 Nagios 的配置文件 /etc/nagios/nagios.cfg 或 /etc/nagios3/nagios.cfg,并确保 cfg_dir 指向包含Nagios 配置文件的目录。
然后,在 cfg_dir 指定的目录中创建一个新的服务定义文件,例如 /etc/nagios3/conf.d/cpu_usage.cfg,并添加以下内容:
define service {
use localservice
host_name your_hostname
service_description CPU Usage
check_command check_nrpe!check_cpu
}
将 your_hostname 替换为目标服务器的主机名或IP地址。
在 Nagios 服务器上,重新加载 Nagios 配置以识别新的服务定义。
sudo systemctl reload nagios
或者在某些系统上可能是:
sudo service nagios reload
在 Nagios 服务器的 Nagios Web界面中,检查新添加的服务状态。你应该能看到 CPU 使用率的监控结果,并根据配置的阈值显示警告或临界状态。
确保 Nagios 服务器能够访问目标服务器上的 NRPE 端口(默认是 5666),按照实际的需求调整警告和临界阈值。确保 Nagios 和 NRPE 的版本与你的操作系统兼容。以上就是华纳云总结的相关方式可以用来设置 Nagios 来监控 Linux 服务器的 CPU 使用率。