Nagios监控路由和交换机设备

1.功能介绍
Nagios可以监控有IP可管理的交换机和路由器的设备状态。对小型无管理功能的交换机和HUB是无法监控。监控的方式是通过外部的ping所反馈的信息或者通过SNMP协议来获取相关的状态信息。
能够在网络设备上获取的信息包括:

包丢失率,包往返时间平均值
SNMP状态信息
带宽和传输数率

2.概述

监控的方式有两种
一种是利用ping的方式,获取数据包的响应时间和丢包率
另一种是利用网络设备的SNMP数据,通过check_snmp获取端口状态和check_mrtgtraf来了解带宽状况。
在使用check_snmp之前必须安装snmp包到系统中。如果没有安装则需要先安装好snmp系统包,然后再重新编译nagios plugins
3.配置步骤

完成第一次执行需要做的操作
创建新的监控设备主机和服务对象
重新启动Nagios

4.确认一下内容

在/usr/local/nagios/etc/objects/commands.cfg里面是否包含了check_snmp和check_local_mrtgtraf的命令定义
在/usr/local/nagios/etc/objects/templates.cfg里面是否包含了generic-switch

5.配置Nagios
a.编辑/usr/local/nagios/etc/nagios.cfg
将#cfg_file=/usr/local/nagios/etc/objects/switch.cfg前面的#去掉
b.编辑/usr/local/nagios/etc/object/switch.cfg文件
设定监控主机的相关内容
define host{
        use        generic-switch        ; Inherit default values from a template
        host_name        Gateway                ; The name we're giving to this switch
        alias        Firewall        ; A longer name associated with the switch
        address        192.168.200.1        ; IP address of the switch
        hostgroups        allhosts,switches        ; Host groups this switch is associated with
        }监控包的丢失率和RTA响应时间
define service{
        use                generic-service        ; Inherit values from a template
        host_name                Gateway        ; The name of the host the service is associated with
        service_description        PING; The service description
        check_command        check_ping!200.0,20%!600.0,60%        ; 在超过200ms或丢包率在20%上的启动警告,超过600ms或丢包达到60%的启动报警
        normal_check_interval        5; 在正常情况下,每五分钟监控一次
        retry_check_interval        1; 在异常情况下,每分钟监控一次
        }
利用SNMP监控交换和网关设备define service{
        use                generic-service        ; Inherit values from a template
        host_name                Gateway
        service_description        Uptime        
        check_command        check_snmp!-C public -o sysUpTime.0
        }
利用MRTG来监控网络流量信息
define service{
use generic-service ; Inherit values from a template
host_name Gateway
service_description Port 1 Bandwidth Usage
check_command check_local_mrtgtraf!/var/lib/mrtg/192.168.200.1_1.log!AVG!1000000,2000000!5000000,5000000!10
}利用command里面设定的check_local_mrtgtraf获取本地保存的mrtg流量日志信息来监控,获取文件是/var/lib/mrtg/192.168.200.1_1.log获取数据值是采取AVG的值,数值在1M~2M之间,则状态改为warning,如果超过5M的话则状态改为critical 完成配置后service nagios restart
参与0

0同行回答

“答”则兼济天下,请您为题主分忧!

提问者

jimli
软件开发工程师jimli
擅长领域: Linux服务器大数据

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2013-06-24
  • 关注会员:0 人
  • 问题浏览:1758
  • X社区推广