如何自动化监控与巡检整合?

可不可以这样理解:巡检可以视作避免发生故障的“事前预防”,监控可以视作故障的“事中定位”,运维管理视作故障的“事后处理”,那么当所有的平台都自动化之后,一些巡检工作还有必要吗,如数据库巡检,如果有必要这么巡检如何与平台有效结合呢?

参与10

1同行回答

jxnxsdengyujxnxsdengyu课题专家组系统工程师江西农信
这个问题很好,你的思路都是正确的,但巡检是非常有必要的,有这么几个点:1.要做到自动化巡检,自动化巡检通常是用脚本跑出输出,人为去看,跑出的输出可以全部存档,但人为去看的部分可以减少,也就是输出结果需要精简和格式化,否则企业需要监控的系统和监控项那么多,需要花费多少人力和精...显示全部

这个问题很好,你的思路都是正确的,但巡检是非常有必要的,有这么几个点:
1.要做到自动化巡检,自动化巡检通常是用脚本跑出输出,人为去看,跑出的输出可以全部存档,但人为去看的部分可以减少,也就是输出结果需要精简和格式化,否则企业需要监控的系统和监控项那么多,需要花费多少人力和精力。
2.要做到自动化巡检脚本的统一、规范和兼容性,有能力可以尽量做一个大的自动化巡检脚本,适用于不同服务器、不同平台、不同厂商、不同操作系统的主机,数据库和中间件。可以针对不同类型的巡检做很多个巡检脚本,但要通过统一的巡检脚本来判断类型进行分门别类的调度,生成不同命名的结果输出文件,给不同的运维工程师。
3.要做到巡检脚本部署的自动化。巡检脚本部署需要做到这一点,统一部署方便,易于修改。新系统上线时,巡检脚本部署工作已经到位,且作为部署流程的一部分。
4.巡检脚本的存档内容可以作为将来运维大数据分析的数据来源。这些文件格式的数据,可以作为监控数据的补充,尤其是有些配置数据,监控是没有的,这些数据将来可为运维大数据提供学习的参考和来源。
巡检作为监控的补充,和运维大数据的部分数据支撑,甚至可以作为配置采集方式,还是有必要的。
粗略就想到这么多。

收起
银行 · 2017-06-07
浏览2619

提问者

bryan
bryan0514
软件架构设计师金融研发
擅长领域: 云计算容器容器云

问题来自

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2017-06-07
  • 关注会员:3 人
  • 问题浏览:4929
  • 最近回答:2017-06-07
  • X社区推广