如果监控做的足够的完善,自动化巡检还有价值么?

之所以要做巡检,是不是因为很多指标无法采集和监控到,需要人去检查?
如果指标都可以采集到,而且都可以进行告警。自动巡检还有什么意义呢?我能想到几点,但感觉都不是有很大的意义:
1、现有的指标告警基于规则,不能够发现潜在问题,而且信息比较分散,需要人基于巡检报告去做分析从而挖掘出深层次的潜在问题。
2、不是所有指标都需要做监控和告警,否则一是频繁的采集指标和告警会有性能问题,二是不重要的指标告警会打扰到运维人员。很多指标每天进行一次巡检来分析一下就可以了。
大家对于自动化巡检怎么看呢?

参与26

8同行回答

zwz99999zwz99999系统工程师dcits
简单说,自动化巡检只是巡检的一个辅助而已,可以帮助做一些巡检中常规的部分;可以简化日常巡检中人工巡检的工作量。但像性能分析、日志分析、深度巡检等预防性巡检、维护还是需要人为去做,可以通过这些分析可以得出系统中潜在的危险和故障点以及系统或者应用的bug,这些都是自...显示全部

简单说,自动化巡检只是巡检的一个辅助而已,可以帮助做一些巡检中常规的部分;可以简化日常巡检中人工巡检的工作量。但像性能分析、日志分析、深度巡检等预防性巡检、维护还是需要人为去做,可以通过这些分析可以得出系统中潜在的危险和故障点以及系统或者应用的bug,这些都是自动化巡检所不能做的。建议自动化巡检和人工巡检相结合。

收起
系统集成 · 2020-08-26
pysx0503pysx0503系统工程师第十区。散人
其实我觉得监控,已经算是自动化巡检中的一部分了。以我解除过的一个环境为例。一款检测软件。定期检测关键信息的状态。如网络,业务,系统资源等,一旦超过阀值,自动邮件推送报警信息,第二通过zabbix监控网络流量,用来掌握网络状况,多种手段结合。自动巡检是为了更快更方便的去了解...显示全部

其实我觉得监控,已经算是自动化巡检中的一部分了。以我解除过的一个环境为例。一款检测软件。定期检测关键信息的状态。如网络,业务,系统资源等,一旦超过阀值,自动邮件推送报警信息,第二通过zabbix监控网络流量,用来掌握网络状况,多种手段结合。自动巡检是为了更快更方便的去了解所管理的目标。监控是为了更直观的看到想要管理的目标信息。但所有的信息都是死的。只有人是活的。巡检报警有可能会误报,也有可能频繁报警。要根据实际的业务去做出调整。
系统架构越来越庞大。要监控的东西也多了,监控也好,自动化巡检也好,都不像以前的单机架构。只凭一些简单的参数阀值就能满足业运维需求了。现在的架构复杂。一点问题就可能导致整个架构的崩塌。而这些问题往往又不完全是简单的是或否的关系。
虽说现在不断的提出自动化运维,智能运维平台。但其实将来系统架构,软件维护对运维的考验会更大,对系统架构设计的考验也会增大。一个是前期设计。一个是后期保养。有任何一个没做好都会惹出大麻烦

收起
系统集成 · 2020-08-21
浏览3057
chinesezzqiangchinesezzqiang课题专家组信息技术经理M
自动巡检是监控的一个不可或缺的组件,所以自动巡检的功能也是监控是否足够完善的必要条件。1.成熟的监控系统几乎都具备自动巡检的能力,只是巡检指标和巡检的能力差异而已;2.监控系统可以细颗粒度的监控各种设备,如网络设备、服务器、存储等等,但是始终需要人工处理故障。但是...显示全部

自动巡检是监控的一个不可或缺的组件,所以自动巡检的功能也是监控是否足够完善的必要条件。
1.成熟的监控系统几乎都具备自动巡检的能力,只是巡检指标和巡检的能力差异而已;
2.监控系统可以细颗粒度的监控各种设备,如网络设备、服务器、存储等等,但是始终需要人工处理故障。但是自动巡检可以实现问题的自动发现,并通过定制好的解决方案自动处理问题,比如重启设备等;
3.自动巡检与监控系统集成可以大幅度降低人工成本,减少错误率;
4.当然并不是监控具备了自动巡检功能,就可以忽略人工的价值,比如火灾、空调异常等等。只是说可以更好的帮助运维人员及时发现问题、解决问题。
5.自动巡检是智能化运维不可或缺的一个组件,随着被监控设备的增加,监控项的细化,其重要性越发凸显。

收起
IT其它 · 2020-08-26
浏览2577
hufeng719hufeng719联盟成员系统工程师某钢铁企业
首先要弄清楚监控与巡检的区别:单从字面理解,监控毕竟只是监控,不是自动化运维,只能预警,不能干预。只能通过采集到的数据进行人为分析(或者机器学习)汇总结果,不能完全的去替代人的操作。就拿我们生产环境而言,可以监控故障,预测设备运行状况。但是真出现问题,不能轻易用系统人为修...显示全部

首先要弄清楚监控与巡检的区别:单从字面理解,监控毕竟只是监控,不是自动化运维,只能预警,不能干预。只能通过采集到的数据进行人为分析(或者机器学习)汇总结果,不能完全的去替代人的操作。就拿我们生产环境而言,可以监控故障,预测设备运行状况。但是真出现问题,不能轻易用系统人为修改参数后去自动控制生产,这会存在很大的安全隐患。如果真感染病毒,会对生产造成非常严重的事故。比如煤气阀门的控制等等。  举这个例子就是想说明,监控只是辅助手段无法完全替代人为的巡检。
巡检在运维过程中发挥着非常重要的作用。且不说现在的自动化运维各项监控指标还不完善,有些监控指标还无法获取真实有效数据,只是存在理论上的可实现,还没有落地。到目前为止,个人感觉,监控无法完全替代巡检。原因如下:
1、如果遇到特殊情况,比如网络中断、监控服务器故障等等,监控获取不到数据。无法确认机房设备是否正常。
2、即使监控指标足够多,如果出现问题,被监控主机死机、服务挂起等远程无法响应的情况怎么办?
3、有些情况是监控无法做到的。比如:机房进老鼠、灰尘多、机房制冷设备异常导致高温等,都需要现场处理。定期巡检可以发现问题并及时进行干预。

收起
能源采矿 · 2020-08-26
raphlguraphlgu项目经理旭升
从运维发展目标看,所有一切都应该转换为自动化。因此"人"应该用来实现自动化,而非补充自动化。自动化不能替代"人",因为自动化不是万能的,它需要"人"为其不断地补充能力,增加经验。同理..."人"不能替代"自动化",因为IT的本质就是提高效率,IT的核心任务就是发现并弥补"人"的缺陷...显示全部

从运维发展目标看,所有一切都应该转换为自动化。因此"人"应该用来实现自动化,而非补充自动化。

自动化不能替代"人",因为自动化不是万能的,它需要"人"为其不断地补充能力,增加经验。
同理...
"人"不能替代"自动化",因为IT的本质就是提高效率,IT的核心任务就是发现并弥补"人"的缺陷。

技术在消灭人的传统价值的同时,也逼迫人发挥更大的优势—创新。所以"人"需要发挥主观能动性,将"自动化"视为核心价值的一种体现方式,让IT变得更聪明,这个过程如同教育。能否将突发型的维护工作转变与自动化的预防工作是IT时刻不忘的初心。

收起
IT咨询服务 · 2020-11-03
浏览2167
jason2006xujason2006xu技术经理昆仑银行
如果监控做的足够的完善,个人觉得自动化巡检价值不太大。理由如下:1、自动化巡检的指标无非就是操作系统、数据库、中间件的某些指标,如磁盘空间、数据库表空间等。2、自动化巡检的周期是天、周、月等,或者重大节假日。3、自动化巡检的指标只能是主动指标,无非包括被动指标,如...显示全部

如果监控做的足够的完善,个人觉得自动化巡检价值不太大。
理由如下:
1、自动化巡检的指标无非就是操作系统、数据库、中间件的某些指标,如磁盘空间、数据库表空间等。
2、自动化巡检的周期是天、周、月等,或者重大节假日。
3、自动化巡检的指标只能是主动指标,无非包括被动指标,如业务系统的成功率、响应率,响应时间等。
4、监控系统主动指标采集数据周期一般为5分钟,包括磁盘空间、数据库表空间、实例、锁表、网络设备性能指标。
5、监控系统被动指标基本为一分钟或者更短时间,如业务系统成功率、响应率、响应时间等。
总之,监控系统的监控指标包括但不限于自动化巡检指标,而且监控系统的也可以出巡检报告,所以说监控系统足够完善的话可以替代自动化巡检。

收起
银行 · 2020-08-26
浏览2534
孙振宇孙振宇技术支持地铁信息化
首先 题目中说述“监控”指的是数据或信息的采集么?自动化巡检指的是人根据系统的指示去检查某项指标么?先这么理解吧,智能运维一定是采集的设备状态信息的维度越多越好,多维度的信息和指标做对比,能够判断设备设施是否出现问题,预判即将出现问题。那么你所说的信息比较分散,需...显示全部

首先 题目中说述“监控”指的是数据或信息的采集么?自动化巡检指的是人根据系统的指示去检查某项指标么?
先这么理解吧,智能运维一定是采集的设备状态信息的维度越多越好,多维度的信息和指标做对比,能够判断设备设施是否出现问题,预判即将出现问题。那么你所说的信息比较分散,需要人去做分析和挖掘。那么我觉得你更需要设计一套规则,让计算机帮你算出潜在问题。因为数据分析和挖掘不是人力可达的。那么智能以外一定有机器代替不了的情况,比如最终解决是人来解决,在比如环境卫生也是人来解决。有些地方的环境是可以影响设备寿命的。我的理解的是机器可以让人少干活,却永远取代不了人来干活。它改变的是我们的工作模式。
我也不知道我理解的是不是跑题了

收起
轨道交通 · 2020-08-21
浏览3026
twsusertwsuser软件开发工程师这是个公司
看是什么行业的,如果只是数据中心,自动化巡检没有那么重要。服务器、机柜、环境动力的信息都可以采集并监控了。如果是电力行业,自动化巡检的对象是变电设备、高压输电线路等,这些很多都没有安装监控的,只能靠巡检。另外,老的设备、机房都没有完善的监控,这样还是需要巡检。监控...显示全部

看是什么行业的,如果只是数据中心,自动化巡检没有那么重要。服务器、机柜、环境动力的信息都可以采集并监控了。
如果是电力行业,自动化巡检的对象是变电设备、高压输电线路等,这些很多都没有安装监控的,只能靠巡检。
另外,老的设备、机房都没有完善的监控,这样还是需要巡检。监控做的完善,只能是理想情况。

收起
互联网服务 · 2020-08-21
浏览3009

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2020-08-21
  • 关注会员:10 人
  • 问题浏览:7995
  • 最近回答:2020-11-03
  • X社区推广