工业制造其它故障诊断系统维护

P550更换硬盘后报错,请各位老师帮忙诊断一下。

机器是P550A本机带有两块硬盘,因硬盘出现咔咔的响声更换硬盘。多谢论坛版主zhenzongjian的帮助,第一次更换硬盘挺紧张的,zhenzongjian版主远程支持说不用紧张让我有了信心。最大的体会是干运维看再多的资料不如动手去实践,过程中会有很多意外出现的要有扎实的理论基础做支撑...显示全部
机器是P550A本机带有两块硬盘,因硬盘出现咔咔的响声更换硬盘。多谢论坛版主zhenzongjian的帮助,第一次更换硬盘挺紧张的,zhenzongjian版主远程支持说不用紧张让我有了信心。最大的体会是干运维看再多的资料不如动手去实践,过程中会有很多意外出现的要有扎实的理论基础做支撑才能顺利的解决问题,在这里很羡慕那些有机器练手的朋友。
      更换硬盘过程就不多说了论坛有很多资料,问题是更换完硬盘后服务器一直在报错。请各位老师诊断一下到底是什么地方出现了问题。
---------------------------------------------------------------------------------------------------------------
# errpt |more
IDENTIFIER TIMESTAMP  T C RESOURCE_NAME  DESCRIPTION
B9735AF4   0415052913 P H hdisk5         SUBSYSTEM COMPONENT FAILURE
B9735AF4   0415052913 P H hdisk4         SUBSYSTEM COMPONENT FAILURE
B9735AF4   0415052913 P H hdisk3         SUBSYSTEM COMPONENT FAILURE
B9735AF4   0415052913 P H hdisk2         SUBSYSTEM COMPONENT FAILURE
B9735AF4   0414195513 P H hdisk5         SUBSYSTEM COMPONENT FAILURE
B9735AF4   0414195513 P H hdisk4         SUBSYSTEM COMPONENT FAILURE
B9735AF4   0414195513 P H hdisk3         SUBSYSTEM COMPONENT FAILURE
B9735AF4   0414195513 P H hdisk2         SUBSYSTEM COMPONENT FAILURE
B9735AF4   0414193813 P H hdisk5         SUBSYSTEM COMPONENT FAILURE
B9735AF4   0414193813 P H hdisk4         SUBSYSTEM COMPONENT FAILURE
B9735AF4   0414193813 P H hdisk3         SUBSYSTEM COMPONENT FAILURE
B9735AF4   0414193813 P H hdisk2         SUBSYSTEM COMPONENT FAILURE
B9735AF4   0414192113 P H hdisk5         SUBSYSTEM COMPONENT FAILURE
B9735AF4   0414192113 P H hdisk4         SUBSYSTEM COMPONENT FAILURE
B9735AF4   0414192113 P H hdisk3         SUBSYSTEM COMPONENT FAILURE
B9735AF4   0414192013 P H hdisk2         SUBSYSTEM COMPONENT FAILURE
B9735AF4   0414105613 P H hdisk5         SUBSYSTEM COMPONENT FAILURE
B9735AF4   0414105613 P H hdisk4         SUBSYSTEM COMPONENT FAILURE
B9735AF4   0414105613 P H hdisk3         SUBSYSTEM COMPONENT FAILURE
B9735AF4   0414105613 P H hdisk2         SUBSYSTEM COMPONENT FAILURE
---------------------------------------------------------------------------------------------------------------
# errpt -aj B9735AF4 |more
---------------------------------------------------------------------------
LABEL:          FCP_ARRAY_ERR6
IDENTIFIER:     B9735AF4

Date/Time:       Mon Apr 15 05:29:38 BEIST 2013
Sequence Number: 1129575
Machine Id:      000800B5D600
Node Id:         ibm01
Class:           H
Type:            PERM
Resource Name:   hdisk5         
Resource Class:  disk
Resource Type:   array
Location:        U787B.001.DNWGN8M-P1-C1-T1-W200600A0B8335308-L3000000000000

Description
SUBSYSTEM COMPONENT FAILURE

Probable Causes
ARRAY DASD MEDIA
POWER OR FAN COMPONENT

Failure Causes
ARRAY DASD MEDIA
POWER OR FAN COMPONENT

        Recommended Actions
        PERFORM PROBLEM DETERMINATION PROCEDURES

Detail Data
SENSE DATA
0600 0308 0000 FF00 0000 0004 0000 0000 0000 0000 0000 0000 0000 0000 7000 0600
0000 0098 0000 0000 3FC6 0600 0000 0000 0000 0000 0000 D524 0000 0000 0000 0000
0008 5000 0000 0000 0000 0000 0000 0000 0000 5347 3831 3830 3438 3438 2020 2020
2020 0623 0500 0003 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0005 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0F6F 5269 3034 3134 3133 2F31 3531 3930 3700 0000 0000 0000 0000 0000
0000 0000 2D60 7000 F205 3704 0000 0000 0000 0000 0000 0000 0000 E800 0000 0010
0000 0000
---------------------------------------------------------------------------
LABEL:          FCP_ARRAY_ERR6
IDENTIFIER:     B9735AF4

Date/Time:       Mon Apr 15 05:29:34 BEIST 2013
Sequence Number: 1129574
Machine Id:      000800B5D600
Node Id:         ibm01
Class:           H
Type:            PERM
Resource Name:   hdisk4         
Resource Class:  disk
Resource Type:   array
Location:        U787B.001.DNWGN8M-P1-C1-T1-W200600A0B8335308-L2000000000000

Description
SUBSYSTEM COMPONENT FAILURE

Probable Causes
ARRAY DASD MEDIA
POWER OR FAN COMPONENT

Failure Causes
ARRAY DASD MEDIA
POWER OR FAN COMPONENT

        Recommended Actions
        PERFORM PROBLEM DETERMINATION PROCEDURES

Detail Data
SENSE DATA
0600 0308 0000 FF00 0000 0004 0000 0000 0000 0000 0000 0000 0000 0000 7000 0600
0000 0098 0000 0000 3FC6 0600 0000 0000 0000 0000 0000 D524 0000 0000 0000 0000
0008 5000 0000 0000 0000 0000 0000 0000 0000 5347 3831 3830 3438 3438 2020 2020
2020 0623 0500 0002 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0005 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0F6F 5241 3034 3134 3133 2F31 3531 3930 3300 0000 0000 0000 0000 0000
0000 0000 2D60 7000 F205 3704 0000 0000 0000 0000 0000 0000 0000 E800 0000 0010
0000 0000
---------------------------------------------------------------------------




# lsvg rootvg
VOLUME GROUP:       rootvg                   VG IDENTIFIER:  0007fb4b0000d6000000011a87a1b1fa
VG STATE:           active                   PP SIZE:        128 megabyte(s)
VG PERMISSION:      read/write               TOTAL PPs:      1092 (139776 megabytes)
MAX LVs:            256                      FREE PPs:       384 (49152 megabytes)
LVs:                11                       USED PPs:       708 (90624 megabytes)
OPEN LVs:           9                        QUORUM:         1 (Disabled)
TOTAL PVs:          2                        VG DESCRIPTORS: 3
STALE PVs:          0                        STALE PPs:      0
ACTIVE PVs:         2                        AUTO ON:        yes
MAX PPs per VG:     32512                                    
MAX PPs per PV:     1016                     MAX PVs:        32
LTG size (Dynamic): 256 kilobyte(s)          AUTO SYNC:      no
HOT SPARE:          no                       BB POLICY:      relocatable收起
参与42

查看其它 36 个回答lock-on的回答

lock-onlock-on系统工程师starsino
这是DS3k-5k系常见错误,也就是LUN发生路径切换,楼主应该看到存储上有个警告灯在亮。

至于怎么解决,有人是检查到发现链路确实有不稳定,也有人是重启存储解决的(比较危险有哥们死在上面的)。

楼主 lspath 看看路径是不是都正常,或者登陆到光交上(portshow {NUM}  博科)看看是不是有条链路错误帧很多,如果都正常,可以试试切换回来,如果无法切换,可以不用理它。
系统集成 · 2013-04-16
浏览1141

回答者

lock-on
系统工程师starsino

lock-on 最近回答过的问题

回答状态

  • 发布时间:2013-04-16
  • 关注会员:2 人
  • 回答浏览:1141
  • X社区推广