系统监控软件怎样取舍,如何有效利用

目前公司使用的监控软件还是挺多的,包括cacti、zabbix等开源软件,也有foglight等收费的产品。但给我的感觉他们更多是作为一种展示手段存在的,比如领导参观视察等等,还没有完全应用于日常IT运维之中。作为我们这些IT运维人员,对此相当困惑,请问应当如何在技术或者管理理念等方面加强,让其真正为IT运维服务。

参与8

2同行回答

jxnxsdengyujxnxsdengyu  系统工程师 , 江西农信
怎么会更多的作为一种展示手段呢?发生了告警事件,不用电话通知或者短信通知运维人员吗?展示只是作为一种辅助发现故障的手段,真正处理了告警,产生了事件,原则上要第一时间通知运维人员。运维人员的紧迫感也要增强,遇到了告警事件,第一时间到现场处理。否则只是事后的查看工具,起不...显示全部

怎么会更多的作为一种展示手段呢?发生了告警事件,不用电话通知或者短信通知运维人员吗?展示只是作为一种辅助发现故障的手段,真正处理了告警,产生了事件,原则上要第一时间通知运维人员。运维人员的紧迫感也要增强,遇到了告警事件,第一时间到现场处理。否则只是事后的查看工具,起不到真正的效果。
另外发生了告警,需要弹出告警弹出框,触发声音告警,警示监控人员。

收起
银行 · 2017-06-07
浏览1924
  • 理想的流程应该就是您说的这样,但目前相去甚远,无奈。。
    2017-06-08
penghuashengpenghuasheng  数字化运维研发团队负责人 , 广发证券
我觉得如果一线运维同事都这样认为,那可能涉及运维管理体系的问题。从“组织、流程、技术”来看运维管理,监控工具属于“技术”范围,技术本质上是为了“组织、流程”赋能,让组织的人与岗位能够按制定的流程或规程顺畅的执行下来。回到监控工具的作用,也应该回到公司的事件管理...显示全部

我觉得如果一线运维同事都这样认为,那可能涉及运维管理体系的问题。从“组织、流程、技术”来看运维管理,监控工具属于“技术”范围,技术本质上是为了“组织、流程”赋能,让组织的人与岗位能够按制定的流程或规程顺畅的执行下来。
回到监控工具的作用,也应该回到公司的事件管理、日常值班、运营分析(容量、性能等)流程上,比如:事件管理上的加快事前发现,事中快速定位、恢复都是不可或缺的范围。当然,领导参观视察也是一个监控数据应用的好场景,让整体动作可观察。

收起
证券 · 2021-02-26
浏览910

提问者

iceman1006
系统工程师LG
擅长领域: 服务器小型机新核心系统

问题来自

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2017-06-07
  • 关注会员:3 人
  • 问题浏览:4497
  • 最近回答:2021-02-26
  • X社区推广