之所以要做巡检,是不是因为很多指标无法采集和监控到,需要人去检查?如果指标都可以采集到,而且都可以进行告警。自动巡检还有什么意义呢?我能想到几点,但感觉都不是有很大的意义:1、现有的指标告警基于规则,不能够发现潜在问题,而且信息比较分散,需要人基于巡检报告去做分析从而挖掘出深层次的潜在问题。2、不是所有指标都需要做监控和告警,否则一是频繁的采集指标和告警会有性能问题,二是不重要的指标告警会打扰到运维人员。很多指标每天进行一次巡检来分析一下就可以了。大家对于自动化巡检怎么看呢?
从运维发展目标看,所有一切都应该转换为自动化。因此"人"应该用来实现自动化,而非补充自动化。
自动化不能替代"人",因为自动化不是万能的,它需要"人"为其不断地补充能力,增加经验。同理..."人"不能替代"自动化",因为IT的本质就是提高效率,IT的核心任务就是发现并弥补"人"的缺陷。
技术在消灭人的传统价值的同时,也逼迫人发挥更大的优势—创新。所以"人"需要发挥主观能动性,将"自动化"视为核心价值的一种体现方式,让IT变得更聪明,这个过程如同教育。能否将突发型的维护工作转变与自动化的预防工作是IT时刻不忘的初心。
关于TWT使用指南社区专家合作厂商入驻社区企业招聘投诉建议版权与免责声明联系我们 © 2024talkwithtrend — talk with trend,talk with technologist京ICP备09031017号-30