之所以要做巡检,是不是因为很多指标无法采集和监控到,需要人去检查?如果指标都可以采集到,而且都可以进行告警。自动巡检还有什么意义呢?我能想到几点,但感觉都不是有很大的意义:1、现有的指标告警基于规则,不能够发现潜在问题,而且信息比较分散,需要人基于巡检报告去做分析从而挖掘出深层次的潜在问题。2、不是所有指标都需要做监控和告警,否则一是频繁的采集指标和告警会有性能问题,二是不重要的指标告警会打扰到运维人员。很多指标每天进行一次巡检来分析一下就可以了。大家对于自动化巡检怎么看呢?
简单说,自动化巡检只是巡检的一个辅助而已,可以帮助做一些巡检中常规的部分;可以简化日常巡检中人工巡检的工作量。但像性能分析、日志分析、深度巡检等预防性巡检、维护还是需要人为去做,可以通过这些分析可以得出系统中潜在的危险和故障点以及系统或者应用的bug,这些都是自动化巡检所不能做的。建议自动化巡检和人工巡检相结合。
关于TWT使用指南社区专家合作厂商入驻社区企业招聘投诉建议版权与免责声明联系我们 © 2024talkwithtrend — talk with trend,talk with technologist京ICP备09031017号-30