jxnxsdengyu
作者jxnxsdengyu课题专家组·2020-04-24 18:23
系统工程师·江西农信

技术技巧---故障处理思路

字数 529阅读 575评论 0赞 2

描述故障

分析故障的第一步是描述故障,如果故障都无法描述、描述不清晰,那么你就无法分析/处理故障了。

如下几个基本问题可以帮助你描述故障:

1、故障的症状/征兆是如何的?

  • 谁报告该故障的?
  • 错误代码/错误信息是什么?
  • 故障怎么发生的?例如:夯死、停止服务、性能下降等
  • 影响了什么业务?

2、故障是在哪里发生的?

  • 是某个系统发生的还是多个系统发生的?
  • 应用运行在本地还是远程?
  • 是否涉及网络?
  • 使用的外置存储还是本地磁盘?
    3、故障是什么时候发生的?
  • 故障发生在白天还是晚上?
  • 发生的频率如何?
  • 诱发该故障的事件顺序如何?
  • 故障发生是否与运行环境改变有关?例如:升级或安装新的软件或硬件
    4、发生故障的条件是什么?
  • 故障发生是否与执行同一件任务有关?
  • 故障发生是否需要某个必然事件呢?
  • 在同一时间点是否还有其他应用失败呢?
    5、故障是否会重复发生?
  • 在测试环境能否复现呢?
  • 是否有其他应用发生了类似的故障呢?
  • 是否可以通过执行一些简单命令、特定程序等复现该故障呢?

    解决故障的思路

1、是否因变更导致或诱发?如果是,是否可以回退。根据故障出现的时间和频率判断。

2、故障是否为原发问题,或者是次生问题?主要是判断相关应用系统和基础环境状态是否正常。

3、关注错误日志,通过关键错误信息解决问题也是一种常见方法。

如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!

2

添加新评论0 条评论

Ctrl+Enter 发表

作者其他文章

X社区推广