如何使用工具有效的提取各类系统日志,进行分析后预测或快速解决系统出现的问题和告警。

如何使用工具有效系统提取各类日志,加以有效分析系统,解决各类系统出现的问题和告警。我理解这个问题,也是各类运维监控系统的主要作用。比如我们现在部分主要系统的监控使用的是Tivoli系统的TEP和TCP两个部分,已经可以对主要的系统环境做各类监控,TEP主要可以监控到操作系统...显示全部

如何使用工具有效系统提取各类日志,加以有效分析系统,解决各类系统出现的问题和告警。

我理解这个问题,也是各类运维监控系统的主要作用。比如我们现在部分主要系统的监控使用的是Tivoli系统的TEP和TCP两个部分,已经可以对主要的系统环境做各类监控,TEP主要可以监控到操作系统层,数据库层,中间件层的一些主要状态,TCP是监控的存储设备和主机类的一些工作状态 。

通过了解和使用,理解它主要是通过抓取各部分的准实时数据,然后结合告警日志功能作用,以及专家的经验(我们这部分没有很好应用)进行分析,给出一些问题原因(处理建议没有还是没有做到不得而知)提示,如果能够及时处理,就可以提前或者及时处理解决相关问题,就可以避免一些问题的发生。

再进一步来理解,还可以通过一些积累和完善,能够预测出一些问题的发生,如果再对一些问题做深入的分析研究,对系统和应用优化等等,改善系统性能,提高系统可靠性等等。就可以进一步提高运维系统的综合效率。

所以这个有效提取分析各类系统日志的作用就特别明显了,不知在日志管理应用方面还有没有更有效的解决方案?希望专家和已经应用的单位能够交流分享一下 。

收起
参与18

查看其它 1 个回答huavi02的回答

huavi02huavi02IT顾问IBM

IBM提供大数据日志分析产品IOA-LA是面向各种日志采集、格式化、索引、入库和搜索查询,一方面针对应用问题的日志查询诊断,类似Splunk这样的能力,另一方面和实时告警监控平台如Netcool/OMNIbus紧耦合形成上下文调用集成,可以基于告警事件关键字上下文钻取相关日志信息,或历史告警发生的各维度分析,尽量避免手工搜索排查动作,以帮助快速定位问题原因并解决问题。

IT咨询服务 · 2016-11-08
浏览1943
  • 感谢介绍,我们有在使用基本的OMNIbus系统,虽然还不够完善,已经能够很好的满足日常的管理了。希望有条件的时候,先学习,研究一下日志分析产品IOA-LA大数据日志分析系统。希望到时能够提供一些具体的帮助。
    2016-11-08
  • 关键是与监控告警软件的联动,这个功能很好
    2016-11-09

回答者

huavi02
IT顾问IBM
擅长领域: 系统运维监控系统管理

huavi02 最近回答过的问题

回答状态

  • 发布时间:2016-11-08
  • 关注会员:3 人
  • 回答浏览:1943
  • X社区推广