监控做不好出现的问题主要有:
1、一个硬件或者一个网络报错,往往会告警出来一片报错,短信量太大,而且总有”狼来了“的假象发生,给运维带来很大困惑。
2、CMDB建设不完善,信息没有实现共享,造成业务、网络、基础设施资源没有实现关联,造成故障无法快速定位。
3、监控指标颗粒没有细化,存在监控不到位或者无法监控。
4、工具不人性化或者功能不完善,造成各个运维人员搭建各自的监控平台,比如存储使用自己的监控TPC等,数据库使用sql监控等,网络使用自己的网管平台等等,各立门户。
5、NPM和BPC使用效果不好,主要是看BPC是不是通过网络流量镜像的方式实现,其实NPM和BPC通过网络流量镜像的资源可以共享,结合日志分析平台可以完善业务系统的监控(BPC)。主要还的完美结合CMDB平台,要不然业务无法实现关联,最终监控效果也会展现不了。