之所以要做巡检,是不是因为很多指标无法采集和监控到,需要人去检查?如果指标都可以采集到,而且都可以进行告警。自动巡检还有什么意义呢?我能想到几点,但感觉都不是有很大的意义:1、现有的指标告警基于规则,不能够发现潜在问题,而且信息比较分散,需要人基于巡检报告去做分析从而挖掘出深层次的潜在问题。2、不是所有指标都需要做监控和告警,否则一是频繁的采集指标和告警会有性能问题,二是不重要的指标告警会打扰到运维人员。很多指标每天进行一次巡检来分析一下就可以了。大家对于自动化巡检怎么看呢?
看是什么行业的,如果只是数据中心,自动化巡检没有那么重要。服务器、机柜、环境动力的信息都可以采集并监控了。如果是电力行业,自动化巡检的对象是变电设备、高压输电线路等,这些很多都没有安装监控的,只能靠巡检。另外,老的设备、机房都没有完善的监控,这样还是需要巡检。监控做的完善,只能是理想情况。
关于TWT使用指南社区专家合作厂商入驻社区企业招聘投诉建议版权与免责声明联系我们 © 2024talkwithtrend — talk with trend,talk with technologist京ICP备09031017号-30