一次0518 usr mnt failed 故障处理失败经过

前几日,上午,客户电话疾呼,两台小机(一台650,一台F80)宕机不能启动,而且启动过程中机器上的液晶屏均停留在0518 USR MNT Failed状态。
      速赶往现场,在路上已经想好对策,无外乎就是引导区损坏或者FS不正常吧,去了fsck或者bosboot一下,应该就可以了,不过两台机器同时报错,还是挺奇怪的。
      进了机房,见客户领导正在训话,探知方知那日早上数台主机宕机,包括还有几台PC Server,心中疑惑,难道黑客侵入了??拿AIX5.1引导盘引导起来那台宕机650,启动正常,rootvg也在,按照提示,按1、2不同选项进入维护模式,fsck -y /dev/hd1,fsck -y /dev/hd2,......直到hd9var,均无错误提示,logform /dev/hd8,回答yes。
bosboot -ad /dev/hdisk0,回车,??显示not found ,奥,看来是这个命令在/usr里,mount /usr,正常,再次bosboot,????? 显示KILLED,打mount ,KILLED,ls,KILLED,reboot,KILLED,shutdown,KILLED。天哪,好像就没有不KILLED的,exit,不KILLED了,但也不能做其它操作了,只好关机重启。
    后面的时间就在两台机器之间折腾,测试各种方法。翻看以前记录,比照这种现象,怀疑是hd5损坏。
“执行bosboot -ad /dev/hdisk0 报错,那么很可能是hd5有问题了,那么删除原来hd5
rm /dev/hd5
rm /dev/rhd5
然后重建hd5
mknod /dev/hd5 b 10 1
mknod /dev/rhd5 c 10 1
bosboot -ad /dev/hdisk0
可以用lslv -m hd5检查hd5信息。”
按照这些步骤在一台机器上作了,还是如故,bosboot依旧不好用,mount /usr,运行命令还是KILLED。无法,翻出一个P5机器的序列号,密码,冒充新机器操作系统损坏打800咨询,回复方式和我原先作的fsck一样,800还是比较负责的,一直电话跟踪。在后来测试中还发现在开始还没有fsck /dev/hd2,就直接mount /usr 的时候,提示 could not table filesystems data.
There is no plausible log device for /dev/hd2.
怀疑/usr的log设备连接丢失。chfs -a log=/dev/hd8 /usr,故障依旧。
后怀疑superblock损坏,dd seek=1 skip=31 count=1 bs=4k if=/dev/hd2 of=/dev/hd2,故障依旧。
最后怀疑filesystems这个文件损坏,进入维护模式操作如下:
mount /dev/hd4 /mnt
mv /mnt/etc/filesystems /mnt/etc/filesystems.bk
cp /etc/filesystems /mnt/etc/filesystems
umount /mnt
exit
在此过程中,发现/mnt里没有etc这个目录!!难道故障原因就是因为etc被删除了??!!另外一台主机情况一样,难道真的有黑客闯进来了???!!!
到此,已经没有别的办法恢复了,而且一旦用系统备份磁带恢复,里面的记录也就没有了,真是高人呀........
等磁带恢复了(倒是挺快的,前后也就1小时),已经晚上7点多了。
吃饭聊天的时候,不禁对此"黑客"“大为崇敬”,无意中被告知,此两台主机密码自从安装完毕一直没有改动,一直是root,知道的人不计其数,天哪..................
参与17

15同行回答

mmsc5166mmsc5166系统工程师某金融公司信息技术中心
很宝贵的一课显示全部

很宝贵的一课

收起
金融其它 · 2016-12-15
浏览2136
hongweigghongweigg系统架构师3C
应该说是通过恢复的方式解决了该问题,没有提供损失更小的解决办法显示全部
应该说是通过恢复的方式解决了该问题,没有提供损失更小的解决办法收起
IT分销/经销 · 2010-10-27
浏览2204
david_2009david_2009工程师tianq
好的经验分享显示全部
好的经验分享收起
IT分销/经销 · 2010-07-14
浏览2209
nhuxynhuxy系统工程师浙江鸿程计算机系统有限公司
我曾经也碰到机器启动时报/usr文件系统full,然后一直起不来。没办法搞了一盘很久以前的备份带来引导恢复系统。也是选择F5,然后按照选择3-recover恢复模式,然后选择2-在mount文件系统之前访问rootvg,但是进去shell交互命令界面后,发现fsck这些命令都不能使用,报“没有找到这些...显示全部
我曾经也碰到机器启动时报/usr文件系统full,然后一直起不来。没办法搞了一盘很久以前的备份带来引导恢复系统。
也是选择F5,然后按照选择3-recover恢复模式,然后选择2-在mount文件系统之前访问rootvg,但是进去shell交互命令界面后,发现fsck这些命令都不能使用,报“没有找到这些命令?“晕! 后来同事重新弄下重启时选择F1—进入sms后,再选择什么东东设备 ,后面就可以执行fsck -y /dev/hd2命令了!难道F5选择不能从磁带引导!!?收起
系统集成 · 2010-03-12
浏览2162
lwb_aixlwb_aix系统工程师重庆南华中天技术有限公司
曾碰到过此类问题,谢谢你的方法。显示全部
曾碰到过此类问题,谢谢你的方法。收起
系统集成 · 2010-01-05
浏览2168
wu88naiwu88nai系统运维工程师科技
学习了,多多分享显示全部
学习了,多多分享收起
互联网服务 · 2009-12-15
浏览3436
mophismophis软件开发工程师杭州
楼主的故障处理经验写的很详细,学习了哦!显示全部
楼主的故障处理经验写的很详细,学习了哦!收起
互联网服务 · 2009-12-10
浏览3441
sfk4911sfk4911engineerCAE
利害,一個tmp.....显示全部
利害,一個tmp.....收起
零售/批发 · 2009-12-10
浏览3465
yangyijun230yangyijun230系统工程师江苏准成
学习ing!:victory:显示全部
学习ing!:victory:收起
系统集成 · 2009-08-05
浏览3467
jeanionjeanion存储工程师dxsed
学习中:handshake显示全部
学习中:handshake收起
系统集成 · 2009-08-03
浏览3487

提问者

power
系统架构师易通
擅长领域: 服务器小型机前置系统

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2009-02-02
  • 关注会员:2 人
  • 问题浏览:16979
  • 最近回答:2016-12-15
  • X社区推广