互联网服务IBM故障b24

IBM B24光纤交换机出现故障,重启就恢复了,奇怪?

前段时间一用户反映TSM无法备份了,我又是远程,又是打800电话,最后感觉应当是TSM服务器无法识别磁带库导致。这个问题还没解决,用户又说磁盘阵列、带库都报警了,但业务没受到影响。叫用户打800用户找IBM,IBM工程师过去检查了半天说是有根光纤线接错导致的,怀疑是TSM工程师去实施...显示全部
前段时间一用户反映TSM无法备份了,我又是远程,又是打800电话,最后感觉应当是TSM服务器无法识别磁带库导致。这个问题还没解决,用户又说磁盘阵列、带库都报警了,但业务没受到影响。叫用户打800用户找IBM,IBM工程师过去检查了半天说是有根光纤线接错导致的,怀疑是TSM工程师去实施的时候改了zone配置和接线,要我们最好找当时实施的小机工程师过去现场检查一下。

       想想系统都跑了一年多了,一直都好好的,怎么突然硬件也报警,TSM也无法备份了呢。没法,只好又是请公司协调叫来了当时去实施小机的IBM代理商去现场检查,节果定位为其中一台光纤交换机故障,据该工程师说交换机硬件没报任何错,但是阵列只有一条链路是通的,应当是光纤交换机坏了,建议报修。

      用户一急,逼着我写方案,还要我飞到现场来处理。另外协调IBM工程师和设备代理商一起到现场解决问题,因为是生产环境,我们一致选择先重启光纤交换机看故障能否恢复,但用网线连接光纤交换机死活都登录不了光纤交换机的WEB界面,明明IP是对的嘛,没法后来只好用串口线登录进去了,一看IP也是对着的,又是检查半天,没发现什么问题,最后重启。

      重启之后一切恢复正常,把带库重启,TSM服务器重启后TSM也恢复正常了。

      现在用户需要就此事给个说法,说明故障是由什么引起的,以后还会不会出现,是否要定时重启一下光纤交换机。当时在现场就问了IBM工程师,他说他也不知道原因。

      请问大家有碰到过么?可能的原因是什么呢,这机房平时都没人进去,设备都运行一年多了,怎么突然光纤交换机就不行了呢,要真不行还好说,但重启又恢复了。怎么跟用户解释这种原因呢?另外找了IBM工程师,但目前还没打通电话,可能是在飞机上,所以就先上论坛来问问了。收起
参与25

查看其它 21 个回答zhangjianjs的回答

zhangjianjszhangjianjs系统管理员zhangjian
学习了 学习了
电信设备制造商 · 2011-11-10
浏览2795

回答者

zhangjianjs
系统管理员zhangjian

zhangjianjs 最近回答过的问题

回答状态

  • 发布时间:2011-11-10
  • 关注会员:1 人
  • 回答浏览:2795
  • X社区推广