IT分销/经销存储IBMds4300

IBM存储DS4300报Unreadable sector(s) detected错误

最近发现小机报LVM的坏块的错误(很多这样的错误)#errptIDENTIFIER TIMESTAMP  T C RESOURCE_NAME  DESCRIPTION80D3764C   1010155911 U H LVDD           PV NO LONGER RELOCATING NEW BAD BLOC...显示全部
最近发现小机报LVM的坏块的错误(很多这样的错误)
#errpt
IDENTIFIER TIMESTAMP  T C RESOURCE_NAME  DESCRIPTION
80D3764C   1010155911 U H LVDD           PV NO LONGER RELOCATING NEW BAD BLOCKS
613E5F38   1010155911 P H LVDD           I/O ERROR DETECTED BY LVM
B0E69588   1010155911 P H hdisk2         ARRAY OPERATION ERROR


#errpt -a
---------------------------------------------------------------------------
LABEL:          LVM_BBFAIL
IDENTIFIER:     80D3764C
Date/Time:       Mon Oct 10 15:59:27 BEIST 2011
Sequence Number: 28508
Machine Id:      00CC6C6E4C00
Node Id:         gzga1
Class:           H
Type:            UNKN
Resource Name:   LVDD            
Resource Class:  NONE
Resource Type:   NONE
Location:        
Description
PV NO LONGER RELOCATING NEW BAD BLOCKS
Probable Causes
NON-MEDIA ERROR DURING SW RELOCATION
Failure Causes
DISK DRIVE
DISK DRIVE ELECTRONICS
STORAGE DEVICE CABLE
Recommended Actions
PERFORM PROBLEM DETERMINATION PROCEDURES
Detail Data
MAJOR/MINOR DEVICE NUMBER
8000 0019 0000 0003
BLOCK NUMBER
            1700650408
ERROR CODE AS DEFINED IN sys/errno.h
         110
SENSE DATA
00CD 15EF 0000 4C00 0000 0109 CDC3 6FBD 00CC 6C6E 2E32 43B6 0000 0000 0000 0000
---------------------------------------------------------------------------
LABEL:          LVM_IO_FAIL
IDENTIFIER:     613E5F38
Date/Time:       Mon Oct 10 15:59:27 BEIST 2011
Sequence Number: 28507
Machine Id:      00CC6C6E4C00
Node Id:         gzga1
Class:           H
Type:            PERM
Resource Name:   LVDD            
Resource Class:  NONE
Resource Type:   NONE
Location:        
Description
I/O ERROR DETECTED BY LVM
Probable Causes
POWER, DRIVE, ADAPTER, OR CABLE FAILURE
Recommended Actions
RUN DIAGNOSTICS AGAINST THE FAILING DEVICE
Detail Data
PHYSICAL VOLUME DEVICE MAJOR/MINOR
8000 0019 0000 0003
ERROR CODE AS DEFINED IN sys/errno.h
         110
BLOCK NUMBER
            1700650408
LOGICAL VOLUME DEVICE MAJOR/MINOR
8000 0064 0000 0069
PHYSICAL BUFFER TRANSACTION TIME
                    21
SENSE DATA
0000 0000 000C ABBB 00CD 15EF 0000 4C00 0000 0109 CDC3 6FBD 00CC 6C6E 2E32 43B6
0000 0000 0000 0000
---------------------------------------------------------------------------
LABEL:          FCP_ARRAY_ERR1
IDENTIFIER:     B0E69588
Date/Time:       Mon Oct 10 15:59:27 BEIST 2011
Sequence Number: 28506
Machine Id:      00CC6C6E4C00
Node Id:         gzga1
Class:           H
Type:            PERM
Resource Name:   hdisk2         
Resource Class:  disk
Resource Type:   array
Location:        U7879.001.DQD1619-P1-C1-T1-W200400A0B8174D3B-L0
Description
ARRAY OPERATION ERROR
Probable Causes
ARRAY DASD MEDIA
Failure Causes
ARRAY DASD MEDIA
Recommended Actions
PERFORM PROBLEM DETERMINATION PROCEDURES
Detail Data
SENSE DATA
0A00 2800 655D DDA8 0000 1004 0000 0000 0000 0000 0020 3A1C 0102 0000 F000 0310
E4FA 2E98 0000 0000 1100 1600 0000 8000 0200 1100 0000 8006 1580 0500 0000 6000
0002 5102 5628 0065 5DDD A800 0010 0400 0000 3154 3434 3737 3333 3633 2020 2020
2020 0612 0300 0000 0100 0700 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0005 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 C153 44E5 3130 3039 3131 2F32 3332 3234 3600 0000 0000 0000 0000 0101
0101 0101 10D5 E000 F705 3207 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000


用SM连上存储后看到如下两个ERROR
1、Degraded Logical Drive
2、Unreadable Sector(s) Detected
且存储的第4块盘亮黄灯

更换存储上报警的硬盘后,重新检测,还有一个报错:Unreadable sector(s) detected

且DS4300存储前面板左上角的警告灯还亮(新换的硬盘灯已经正常了),且小机仍然会报那个LVM错误

通过SM里的恢复坏道菜单,看到如下结果:
Logical Drive  LUN  Accessible By  Date/Time         Logical Drive LBA  Drive Location       Drive LBA   Failure Type  
gagzhou        0    Default Group  11-9-28 15:53:03  0x109d523          Enclosure 0, Slot 4  0x2c4e23    Logical      
gagzhou        0    Default Group  11-9-28 15:52:58  0x109d5a3          Enclosure 0, Slot 5  0x2c4e23    Physical      
gagzhou        0    Default Group  11-9-23 10:25:24  0x655dddae         Enclosure 0, Slot 4  0x10e4fa2e  Logical      
gagzhou        0    Default Group  11-9-23 7:49:41   0x655dde2e         Enclosure 0, Slot 5  0x10e4fa2e  Physical      
备注:存储的第4块硬盘是新换的硬盘

以上信息是不是就是指存储的第4块盘有逻辑坏道,第5块盘有物理坏道,这些坏道是不是得通过SM软件的相应菜单里clear掉(我想,逻辑坏道应该可以清除,但物理坏道就不知道能不能清除了),还是得把第5块盘也换掉,使之变成逻辑坏道后才能一起clear掉。

因为以前没处理过这样的事情,请高手指教!谢谢!收起
参与23

查看其它 14 个回答yang3518的回答

yang3518yang3518  系统工程师 , IBM长沙分公司
应该有一个硬盘坏了, lsvg -p rootvg或者别的vg就可以看到了
互联网服务 · 2012-04-23
浏览6688

回答者

yang3518
系统工程师IBM长沙分公司
擅长领域: 存储服务器灾备

yang3518 最近回答过的问题

回答状态

  • 发布时间:2012-04-23
  • 关注会员:1 人
  • 回答浏览:6688
  • X社区推广