如何使用工具有效系统提取各类日志,加以有效分析系统,解决各类系统出现的问题和告警。
我理解这个问题,也是各类运维监控系统的主要作用。比如我们现在部分主要系统的监控使用的是Tivoli系统的TEP和TCP两个部分,已经可以对主要的系统环境做各类监控,TEP主要可以监控到操作系统层,数据库层,中间件层的一些主要状态,TCP是监控的存储设备和主机类的一些工作状态 。
通过了解和使用,理解它主要是通过抓取各部分的准实时数据,然后结合告警日志功能作用,以及专家的经验(我们这部分没有很好应用)进行分析,给出一些问题原因(处理建议没有还是没有做到不得而知)提示,如果能够及时处理,就可以提前或者及时处理解决相关问题,就可以避免一些问题的发生。
再进一步来理解,还可以通过一些积累和完善,能够预测出一些问题的发生,如果再对一些问题做深入的分析研究,对系统和应用优化等等,改善系统性能,提高系统可靠性等等。就可以进一步提高运维系统的综合效率。
所以这个有效提取分析各类系统日志的作用就特别明显了,不知在日志管理应用方面还有没有更有效的解决方案?希望专家和已经应用的单位能够交流分享一下 。
收起