如何更好的建设日志分析

我们现在解决问题的线索大部分是从日志分析得来的,现有的解决问题的思路也是大同小异的。那么通过建设日志分析,实现故障处理自动化,理论上也是可以的。我们公司现在只能做到日志分析,至于分析后故障自动化处理还在研究中。对于日志分析,大家有什么经验谈谈呗...显示全部

我们现在解决问题的线索大部分是从日志分析得来的,现有的解决问题的思路也是大同小异的。那么通过建设日志分析,实现故障处理自动化,理论上也是可以的。我们公司现在只能做到日志分析,至于分析后故障自动化处理还在研究中。对于日志分析,大家有什么经验谈谈呗

收起
参与16
  • 请问面对不规范格式的日志是怎么做自动化分析的?
    2018-11-30

查看其它 1 个回答qq373793057的回答

qq373793057qq373793057课题专家组系统工程师某银行

日志分析是定位故障最基础的数据来源,对日志分析的整个流程,无非就是日志采集、存储、处理、分析及故障定位这几个关键步骤。

早期的自动化运维工具和一些监控工具大都是利用系统日志来触发告警,如今的自动化运维慢慢发展到要结合企业CMDB的建设,但CMDB中,日志同样也是重要的配置项。

如果仅仅要对日志分析,可考虑使用如ELK、Hadoop等一些工具,无论是使用工具与否,做好日志分析,还是要从以上所说的几个关键步骤来做:

日志采集上要注意对大量异构日志的采集方法,做到可持续高速即可。

日志存储上方面可借助一些非关系型数据库,保证存储能够水平扩展以及进行全文索引。

日志处理分析层面要结合相关的情景数据进行监控和关联分析,这也是快速定位故障的关键。

而您所说下一步故障的自动处理,甚至是系统的自愈,这就需要大规模的实践了,风险也比较大,具体故障场景要具体分析恢复策略。

银行 · 2017-04-28
浏览2752

回答者

qq373793057
系统工程师某银行
擅长领域: 存储灾备分布式系统

qq373793057 最近回答过的问题

回答状态

  • 发布时间:2017-04-28
  • 关注会员:4 人
  • 回答浏览:2752
  • X社区推广