首先,感谢各位大神的鼎力相助!这次系统故障维修过程异常艰难,各位废寝忘食,实属不易!
其次,我大概说一下处理过程,大家学习、共勉。
最初接到故障报告,系统提示JDBC连接错误,我以为是磁盘阵列的VG没有VARYON导致,所以用ROOT账户登录AIX系统,运行varyonvg datavg,意外报错。Lspv看了一下,所有PV都available(就是这个available导致我连续几天陷入歧途),之后exportvg datavg,准备在逻辑上重新插拔一下VG,结果在export成功后,运行importvg -y datavg hdisk2却失败了,当时的系统状态是lsvg后只有rootvg,datavg不见了!!!只好继续rmdev -l hdisk2,计划删除hdisk2之后再重新识别,删除成功后cfgmgr -v,hdisk2是识别出来了,但是PVID不见了,所有状态全部显示none。当时的系统状态是:没有数据卷组,没有物理磁盘,离启动数据库的目标越来越远!
几乎绝望之时群里老大电话里提醒我不要纠结于小机系统,尝试在存储和网络上找找原因。旁观者,相当清。我登录storage manager查看DS4700磁盘状态,9块磁盘做了RAID5,有3块硬盘报错!之前lspv提供的available信息是错误的!@王仙儿耐心地告诉我:RAID5,最多允许坏两块硬盘,如果坏了三块,需要更换硬盘,并且重新安装数据库和配置,数据会全部丢失!!!
这回彻底绝望了,准备花钱报修买零件。而我在心里其实是不太愿意相信,好好的系统就在我手上瘫掉了。@收电冰箱热水器-西哥哥在QQ上意外发来消息,告诉我先不要花钱,坏掉的硬盘可以revive!我将信将疑地操作了一遍,raid5启动了!
然而!系统仍然无法启动!蒙比了!数据库正常,select正常,系统后台服务正常,网络正常,就是无法启动系统!
之后尝试登录pl/sql提示无TNS监听程序!重新配置监听程序,无效!只好运行lsnrctl start,搞定!
之后在@雷总的帮助下varyon,mount和startup操作一切操作顺利无比,一个字:舒畅!
整整一周,一头扎进这个系统的维修中,扔了很多工作和事情,可我觉得值得,我知道有人会在我最困难的时候站出来帮助我,自己也仿佛打通了任督二脉,可以藐视AIX和存储系统了!
上文已发至TWT论坛,共勉。