AIX SAN BOOT分区无法正常启动,报错0518?

环境:PowerVM环境 ,VIOS通NPIV和SEA方式为VIOC提供SAN和以太网服务。
现象:rootvg下一个LV挂载点的子目录文件系统只读(举例:/tmp/abc/目录只读,/tmp/目录可以正常读写,其它rootvg下的lv目录读写正常)。errpt无报错,手动重启后无法正常启动,报错代码:0518
处理远程:光盘引导进入维护模式,fsck 逐个修复文件系统,发现hd9var无法修复,无奈之下重装系统

顺便分享一个官方解决案例,有需要的拿走:
Note:https://www.ibm.com/support/pages/node/669249
心存疑问:正常情况下SAN boot磁盘不会出现磁盘坏块的情况 ,存储检查也没发现异常,让我百思不得其解。
邀各路专家高手,前来指点
问题:1.些类问题排查思路;2.对存储盘怎么做坏块检测;3.导致磁盘坏块的常见原因;4.如何追索根源;

4回答

youki2008youki2008  系统架构师 , DDT
wfang_2020wangxqtuomi2013赞同了此回答
这种情况下san存储有坏块也是可能的, bosboot尝试做一下看看呢。 显示全部

这种情况下san存储有坏块也是可能的, bosboot尝试做一下看看呢。

收起
 2020-04-24
  • bosboot设置不成功,提示killed,最终还是选择了重装。。SAN BOOT有风险啊
    2020-04-26
张文正张文正  系统工程师 , its
z_zwzz_zwz99999赞同了此回答
这个不一定,san存储有坏块也是可能的,你可以把aix 的iso 上传到vios上,不知道你有没有配置vscsi,如果有的话,vioc也创建vscsi,然后做好映射后,把iso load光驱里面,启动vioc就和平常一样光驱引导进入维护模式修复一下文件系统!你既然试过了,fsck 不行估计是这个lv有坏块了!实在不...显示全部

这个不一定,san存储有坏块也是可能的,你可以把aix 的iso 上传到vios上,不知道你有没有配置vscsi,如果有的话,vioc也创建vscsi,然后做好映射后,把iso load光驱里面,启动vioc就和平常一样光驱引导进入维护模式修复一下文件系统!你既然试过了,fsck 不行估计是这个lv有坏块了!实在不行如果有系统备份nim恢复吧!

收起
 2020-04-03
  • 那存储侧有没有方法可以提早发现坏块?或者说主机端有发现的方法也可以。SAN boot其实就是想规避坏块的问题引起系统宕机,而近2年时间内遇到多起类似的存储盘坏块,导致系统无法正常启动的情况。
    2020-04-03
lipeng9239lipeng9239  系统运维工程师 , 北京智控美信
fsck 的力度不够啊,带-p试试,不行就-y,应该是可以修复的。 这里说的超级块损坏,是记录文件系统inode信息的逻辑配置损坏了,跟错误操作、服务器掉电等有关系,不一定是磁盘或者存储上的物理块损坏。...显示全部

fsck 的力度不够啊,带-p试试,不行就-y,应该是可以修复的。
这里说的超级块损坏,是记录文件系统inode信息的逻辑配置损坏了,跟错误操作、服务器掉电等有关系,不一定是磁盘或者存储上的物理块损坏。

收起
 2020-04-08
浏览736
BOCDanielBOCDaniel  系统工程师 , BOC
bosbosbootboot做一下做一下显示全部

bosbosbootboot做一下做一下

收起
 2020-04-03
浏览849

提问者

y453056108r系统运维工程师, 某IT公司

问题状态

  • 发布时间:2020-04-03
  • 关注会员:6 人
  • 问题浏览:2670
  • 最近回答:2020-04-24