一台交换机就有250个监控项,一共有100多台交换机,请问如何优化监控项?

交换机监控项太多,有哪些项可以不用监控?1台交换机就有250个监控项了,一共有100多台交换机。显示全部

交换机监控项太多,有哪些项可以不用监控?1台交换机就有250个监控项了,一共有100多台交换机。

收起
参与13

查看其它 1 个回答skey_deng的回答

skey_dengskey_deng系统运维工程师某农商业银行股份有限公司

个人认为交换机也需要按照不同的功能进行区分监控:
1、核心交换,要全面监控,硬件信息包括CPU,内存,板块,电源模块,风扇,端口是否故障等,要监控arp表,mac地址表变化等,要监控各端口总流量,上行流量,下行流量,峰值流量,丢包状况等;
2、接入交换(边缘交换)则仅监控硬件,以及端口总流量,上行流量,下行流量,峰值流量,丢包状况等即可,而且监控频率也可以调低,比如对于边缘交换的硬件则可以10分钟,30分钟监控一次,尤其是硬件的取值,因为接入交换重要程度地,硬件性能较差,如果监控频率高会影响硬件本身的性能。
3、对于两项的硬件监控,监控指标可以优化,正常情况下的监控系统对于CPU,内存等硬件都会有很多指标项,网络设备对于CPU,内存等硬件的依赖性不高(不排除特殊情况,此处仅是对比服务器之类的硬件来说),那么就可以只监控其可用性(好坏),以及使用率就可以。
4、对于端口流量的健康则要稍微频繁一点,这个根据贵公司的RPO,RTO要求进行设置,最高频率不超过30秒每次,否则会对设备产生性能压力。
我们对于核心交换是5分钟抽取一次硬件的监控信息,1分钟抽取一次流量信息,对于接入交换则采用30分钟抽取一次硬件信息,3分钟抽取一次流量信息的方式。
硬件监控包括,CPU可用性,CPU使用率,内存可用性,内存使用率,板块可用性,电源模块可用性,端口可用性
端口流量包括总流量,端口上行带宽,端口上行带宽峰值,端口下行带宽,端口下行带宽峰值,端口总流量,端口总流量峰值,丢包数,丢包比率

银行 · 2019-08-20

回答者

skey_deng
系统运维工程师某农商业银行股份有限公司
擅长领域: 存储灾备双活

skey_deng 最近回答过的问题

回答状态

  • 发布时间:2019-08-20
  • 关注会员:3 人
  • 回答浏览:4345
  • X社区推广