这个问题其实蛮好的。因为并非所有日志型告警事件都会带出告警级别。而这一点在性能型告警上,却很容易实现。只要判断当前值与情景属性值或者触发器判断项的大小,就可以直接进行告警级别分级。
除去有些日志型告警事件会带出告警级别外,比如WINDOWS EVENT LOG、DB2 LOG等,还有SNMP TRAP类的告警事件也会带出告警级别。其他一些不带出告警级别的事件,只能通过关键字匹配的方式,自动匹配我们预设的知识库,来补充该告警事件的信息,并将匹配的结果,反馈至告警事件中,用文字说明这条告警的严重性。这就需要对一些常见的日志型事件关键字进行解析,并录入至知识库,比如说AIX的ERRPT代码,比如说DB2的MESSAGE ID,比如说存储的ERROR ID,比如说HMC的SRC码等,录入后,并对常见的每个代码进行文字解析和描述,同时附上该告警的中文处理方法,让不怎么了解系统的人,也能知道这条告警事件的详细意义,才不会忽略该告警,造成未及时通知带来的生产系统灾难性故障。但同时,知识库的录入工作也需要很长时间的积累和长期的完善。