power595设备引起的宕机事件

案例一:设备型号IBM Power595

事件起因,本来巡检已经发现其中的一个I/O柜电源故障,在线更换走脚步的时候,脚步执行到一半引起该I/O柜突然掉电,解决方法重启了该I/O柜

原因引起:一线工程师巡检时候不够仔细,因为该同一个I/O其实坏了2个电源,只不过另外一个没有报错来具体的位置,但已经报出来该I/O的部件号,但也说明了IBM小机没有完全报错具体槽位,只报错了大概的位置;

解决方法:设备下电,更换两个I/O DCA,然后设备开机,问题解决。

参与4

1同行回答

myciciymyciciyIT顾问某金融科技公司
一线运维确实不够自信,放过了隐患的给宕机买下了种子。越是离谱的宕机事件,问题往往越简单,越容易被忽视。显示全部

一线运维确实不够自信,放过了隐患的给宕机买下了种子。越是离谱的宕机事件,问题往往越简单,越容易被忽视。

收起
银行 · 2017-03-02
浏览1737

提问者

shizhe1030
软件开发工程师北京某某科技有限公司
擅长领域: 服务器系统运维存储

问题来自

问题状态

  • 发布时间:2017-03-01
  • 关注会员:3 人
  • 问题浏览:5256
  • 最近回答:2017-03-02
  • X社区推广