告警事件描述如何设置

日常运维人员不一定对所有系统都熟悉 告警事件描述如何设置才能既兼顾各个重点又不那么晦涩难懂

参与7

1同行回答

jxnxsdengyujxnxsdengyu课题专家组系统工程师江西农信
这就需要对每条告警事件的内容进行适当汉化和丰富,你想想看,要是不对告警内容进行汉化和丰富,通常告警内容是:IP+一串英文代码。熟悉的运维人员还可以看得懂,不熟悉的人,或者不是搞这类系统维护工作的人,看了该作何感想。有点责任心的人会上系统看看怎么回事,没有责任心的,看到十...显示全部

这就需要对每条告警事件的内容进行适当汉化和丰富,你想想看,要是不对告警内容进行汉化和丰富,通常告警内容是:IP+一串英文代码。熟悉的运维人员还可以看得懂,不熟悉的人,或者不是搞这类系统维护工作的人,看了该作何感想。有点责任心的人会上系统看看怎么回事,没有责任心的,看到十分陌生的告警,还可能以为不重要的告警。这样带来的就是,经常性没有将需要通知或者紧急处理的告警给遗漏。
另外一点,如果没有对告警事件进行适当汉化和丰富,带来的就是需要处理的告警事件过多,常常每天就在查看、分析这些告警事件了,其他工作无从分心。

所以怎么适当汉化和丰富就显得非常重要了,我个人推荐这样的方式:
告警级别+应用名称+设备名称+设备IP+适当汉化的告警事件描述+系统联系人+应用联系人
其他更高级的丰富还有告警类型+设备位置+设备所处的数据中心+告警事件来源+告警处理方法等
这里“适当汉化的告警描述”是指尽量保留原汁原味的告警消息,但需要对告警加一些汉字的修饰符和警示语,比如“较高”,“非常高”,“请立即处理”等等,并带出一些告警关键变量,比如说“值的大小”,“SRC码”,“数据库名称”,“监听端口号”,“ERROR ID”等等。
这样对于每一个IT从业者来说,你不需要了解IT系统,你不需要了解运维,你也能读懂这条告警事件的含义,甚至还能通过告警处理方法,了解一些知识,还能够处理一些紧急故障等。

收起
银行 · 2017-06-06
浏览2156

提问者

wanhy
系统架构师某金融机构
擅长领域: 存储存储虚拟化虚拟化

问题来自

问题状态

  • 发布时间:2017-06-06
  • 关注会员:2 人
  • 问题浏览:5033
  • 最近回答:2017-06-06
  • X社区推广