cuizengshun
作者cuizengshun·2017-02-07 09:24
系统运维工程师·民生银行

aix系统运维案例(五):AIX操作系统宕机(netstat BUG导致)

字数 601阅读 9503评论 6赞 11

故障描述

AIX异常宕机,随后自动启动,业务系统恢复正常。
经检查该系统正常产生dump,本文档对dump数据进行分析,分析宕机原因。

系统环境

AIX 6.1 TL06 SP1

故障分析

(1) 分析errpt数据

首先分析操作系统的errpt数据,操作系统在宕机前后并没有相关的硬件告警,因此排除硬件问题产生宕机。errpt中宕机相关信息如下:


从上面报错内容来看,可以看到是DATA STORAGE INTERRUPT ADDRESS REGISTER(DSI)导致的系统宕机,这往往是由于操作系统内存访问寄存器内容不正常时导致。下面通过dump分析进行验证。

(2)分析dump数据
从dump数据来看,系统在宕机时的状态

检查dump的内容,可知操作系统在执行netstat命令时触发系统bug,导致系统宕机。

分析结论

经分析本次宕机是由于AIX操作系统的BUG导致,该BUG的描述为:

BUG具体的描述如下:
http://www-01.ibm.com/support/docview.wss?uid=isg1IZ97166

宕机的节点操作系统版本为6100-06-01,这个问题在6100-06-06时已经被解决掉。
因此建议对该操作系统进行版本升级:升级至6100-06-08或6100-07-05(基线)。

相关版本分析

该BUG在AIX 7.1的下面版本中被解决。


该BUG在AIX 6.1的下面版本中被解决。

如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!

11

添加新评论6 条评论

xiangxiang1999xiangxiang1999系统架构师北京某技术公司
2023-08-03 10:59
谢谢分享!
qingtingzheqingtingzhe333jj
2021-01-18 23:19
厉害厉害
wuwenpinwuwenpin软件开发工程师南京
2019-03-30 07:04
感谢分享!收藏了。
caopeibaocaopeibao系统工程师南京壹进制信息技术股份有限公司
2019-03-29 17:48
很有参考价值
myfullermyfuller系统工程师rongke
2019-03-26 10:25
很有参考价值
zhanghaiyangzhanghaiyang系统工程师联合网讯
2017-02-17 10:06
很有参考价值
Ctrl+Enter 发表

本文隶属于专栏

PowerVC专栏
本专栏主要分享PwerVM和PowerVC相关方面的架构、实施、运维等经验,以及企业私有云建设的相关经验及总结。

作者其他文章

相关文章

相关问题

相关资料

X社区推广