如果监控做的足够的完善,自动化巡检还有价值么?

之所以要做巡检,是不是因为很多指标无法采集和监控到,需要人去检查?如果指标都可以采集到,而且都可以进行告警。自动巡检还有什么意义呢?我能想到几点,但感觉都不是有很大的意义:1、现有的指标告警基于规则,不能够发现潜在问题,而且信息比较分散,需要人基于巡检报告去做分析从而挖...显示全部

之所以要做巡检,是不是因为很多指标无法采集和监控到,需要人去检查?
如果指标都可以采集到,而且都可以进行告警。自动巡检还有什么意义呢?我能想到几点,但感觉都不是有很大的意义:
1、现有的指标告警基于规则,不能够发现潜在问题,而且信息比较分散,需要人基于巡检报告去做分析从而挖掘出深层次的潜在问题。
2、不是所有指标都需要做监控和告警,否则一是频繁的采集指标和告警会有性能问题,二是不重要的指标告警会打扰到运维人员。很多指标每天进行一次巡检来分析一下就可以了。
大家对于自动化巡检怎么看呢?

收起
参与26

查看其它 7 个回答jason2006xu的回答

jason2006xujason2006xu技术经理昆仑银行

如果监控做的足够的完善,个人觉得自动化巡检价值不太大。
理由如下:
1、自动化巡检的指标无非就是操作系统、数据库、中间件的某些指标,如磁盘空间、数据库表空间等。
2、自动化巡检的周期是天、周、月等,或者重大节假日。
3、自动化巡检的指标只能是主动指标,无非包括被动指标,如业务系统的成功率、响应率,响应时间等。
4、监控系统主动指标采集数据周期一般为5分钟,包括磁盘空间、数据库表空间、实例、锁表、网络设备性能指标。
5、监控系统被动指标基本为一分钟或者更短时间,如业务系统成功率、响应率、响应时间等。
总之,监控系统的监控指标包括但不限于自动化巡检指标,而且监控系统的也可以出巡检报告,所以说监控系统足够完善的话可以替代自动化巡检。

银行 · 2020-08-26
浏览2535

回答者

jason2006xu
技术经理昆仑银行
擅长领域: 系统运维监控云计算

jason2006xu 最近回答过的问题

回答状态

  • 发布时间:2020-08-26
  • 关注会员:10 人
  • 回答浏览:2535
  • X社区推广